home *** CD-ROM | disk | FTP | other *** search
/ Info-Mac 3 / Info_Mac_1994-01.iso / Development / General / GCC 1.37.1r15 / Sources / loop.c < prev    next >
Text File  |  1990-03-15  |  157KB  |  5,236 lines

  1. /* Move constant computations out of loops.
  2.    Copyright (C) 1987, 1988, 1989 Free Software Foundation, Inc.
  3.    Copyright (C) 1989, 1990 Apple Computer, Inc.
  4.  
  5. This file is part of GNU CC.
  6.  
  7. GNU CC is free software; you can redistribute it and/or modify
  8. it under the terms of the GNU General Public License as published by
  9. the Free Software Foundation; either version 1, or (at your option)
  10. any later version.
  11.  
  12. GNU CC is distributed in the hope that it will be useful,
  13. but WITHOUT ANY WARRANTY; without even the implied warranty of
  14. MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  15. GNU General Public License for more details.
  16.  
  17. You should have received a copy of the GNU General Public License
  18. along with GNU CC; see the file COPYING.  If not, write to
  19. the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.  */
  20.  
  21.  
  22. /* This is the loop optimization pass of the compiler.
  23.    It finds invariant computations within loops and moves them
  24.    to the beginning of the loop.  Then it identifies basic and 
  25.    general induction variables.  Strength reduction is applied to the general
  26.    induction variables, and induction variable elimination is applied to
  27.    the basic induction variables.
  28.  
  29.    It also finds cases where
  30.    a register is set within the loop by zero-extending a narrower value
  31.    and changes these to zero the entire register once before the loop
  32.    and merely copy the low part within the loop.
  33.  
  34.    Most of the complexity is in heuristics to decide when it is worth
  35.    while to do these things.  */
  36.  
  37. /* ??? verify_loop would run faster if we made one table
  38.    of the minimum and maximum luids from which each label is reached.
  39.    Also, it would be faster if loop_store_addrs were a hash table.  */
  40.  
  41. #include "config.h"
  42. #include "rtl.h"
  43. #include "expr.h"
  44. #include "insn-config.h"
  45. #include "regs.h"
  46. #include "hard-reg-set.h"
  47. #include "recog.h"
  48. #include "flags.h"
  49. #include <stdio.h>
  50.  
  51. /* Vector mapping INSN_UIDs to luids.
  52.    The luids are like uids but increase monononically always.
  53.    We use them to see whether a jump comes from outside a given loop.  */
  54.  
  55. static int *uid_luid;
  56.  
  57. /* Get the luid of an insn.  */
  58.  
  59. #define INSN_LUID(INSN) (uid_luid[INSN_UID (INSN)])
  60.  
  61. /* 1 + largest uid of any insn.  */
  62.  
  63. static int max_uid;
  64.  
  65. /* 1 + luid of last insn.  */
  66.  
  67. static int max_luid;
  68.  
  69. /* Nonzero if somewhere in the current loop
  70.    there is either a subroutine call,
  71.    or a store into a memory address that is not fixed,
  72.    or a store in a BLKmode memory operand,
  73.    or too many different fixed addresses stored in
  74.    to record them all in `loop_store_addrs'.
  75.  
  76.    In any of these cases, no memory location can be regarded
  77.    as invariant.  */
  78.  
  79. static int unknown_address_altered;
  80.  
  81. /* Nonzero if somewhere in the current loop there is a store
  82.    into a memory address that is not fixed but is known to be
  83.    part of an aggregate.
  84.  
  85.    In this case, no memory reference in an aggregate may be
  86.    considered invariant.  */
  87.  
  88. static int unknown_aggregate_altered;
  89.  
  90. /* Nonzero if somewhere in the current loop there is a store
  91.    into a memory address other than a fixed address not in an aggregate.
  92.  
  93.    In this case, no memory reference in an aggregate at a varying address
  94.    may be considered invariant.  */
  95.  
  96. static int fixed_aggregate_altered;
  97.  
  98. /* Nonzero if there is a subroutine call in the current loop.
  99.    (unknown_address_altered is also nonzero in this case.)  */
  100.  
  101. static int loop_has_call;
  102.  
  103. /* Added loop_continue which is the NOTE_INSN_LOOP_CONT of the
  104.    current loop.  A continue statement will generate a branch to
  105.    NEXT_INSN (loop_continue).  */
  106.  
  107. static rtx loop_continue;
  108.  
  109. /* Indexed by register number, contains the number of times the reg
  110.    is set during the loop being scanned.
  111.    During code motion, -1 indicates a reg that has been made a candidate.
  112.    After code motion, regs moved have 0 (which is accurate now)
  113.    while the failed candidates have the original number of times set.
  114.  
  115.    Therefore, at all times, 0 indicates an invariant register;
  116.    -1 a conditionally invariant one.  */
  117.  
  118. static short *n_times_set;
  119.  
  120. /* Original value of n_times_set; same except that this value
  121.    is not set to -1 for a reg whose sets have been made candidates
  122.    and not set to 0 for a reg that is moved.  */
  123.  
  124. static short *n_times_used;
  125.  
  126. /* Nonzero means reg N has already been moved out of one loop.
  127.    This reduces the desire to move it out of another.  */
  128.  
  129. static char *moved_once;
  130.  
  131. /* Array of fixed memory addresses that are stored in this loop.
  132.    If there are too many to fit here,
  133.    we just turn on unknown_address_altered.  */
  134.  
  135. #define NUM_STORES 10
  136. static rtx loop_store_addrs[NUM_STORES];
  137. static int loop_store_widths[NUM_STORES];
  138.  
  139. /* Index of first available slot in above array.  */
  140. static int loop_store_addrs_idx;
  141.  
  142. /* Count of movable (i.e. invariant) instructions discovered in the loop.  */
  143. static int num_movables;
  144.  
  145. /* Count of memory write instructions discovered in the loop.  */
  146. static int num_mem_sets;
  147.  
  148. /* Number of loops contained within the current one, including itself.  */
  149. static int loops_enclosed;
  150.  
  151. /* Bound on pseudo register number before loop optimization.
  152.    A pseudo has valid regscan info if its number is < old_max_reg.  */
  153. static int old_max_reg;
  154.  
  155. /* During the analysis of a loop, a chain of `struct movable's
  156.    is made to record all the movable insns found.
  157.    Then the entire chain can be scanned to decide which to move.  */
  158.  
  159. struct movable
  160. {
  161.   rtx insn;            /* A movable insn */
  162.   rtx set_src;                  /* The expression this reg is set from.
  163.                    Either SET_SRC (body) or a REG_EQUAL.  */
  164.   int consec;            /* Number of consecutive following insns 
  165.                    that must be moved with this one.  */
  166.   int regno;            /* The register it sets */
  167.   short lifetime;        /* lifetime of that register;
  168.                    may be adjusted when matching movables
  169.                    that load the same value are found.  */
  170.   short savings;        /* Number of insns we can move for this reg,
  171.                    including other movables that force this
  172.                    or match this one.  */
  173.   unsigned int cond : 1;    /* 1 if only conditionally movable */
  174.   unsigned int force : 1;    /* 1 means MUST move this insn */
  175.   unsigned int global : 1;    /* 1 means reg is live outside this loop */
  176.         /* If PARTIAL is 1, GLOBAL means something different:
  177.            that the reg is live outside the range from where it is set
  178.            to the following label.  */
  179.   unsigned int done : 1;    /* 1 inhibits further processing of this */
  180.   /* 1 in PARTIAL means this reg is used for zero-extending.
  181.      In particular, moving it does not make it invariant.  */
  182.   unsigned int partial : 1;
  183.   enum machine_mode savemode;   /* Nonzero means it is a mode for a low part
  184.                    that we should avoid changing when clearing
  185.                    the rest of the reg.  */
  186.   struct movable *match;    /* First entry for same value */
  187.   struct movable *forces;    /* An insn that must be moved if this is */
  188.   struct movable *next;
  189. };
  190.  
  191. static FILE *loop_dump_stream;
  192.  
  193. /* Forward declarations.  */
  194.  
  195. struct induction;
  196. struct iv_class;
  197.  
  198. static rtx verify_loop ();
  199. static int invariant_p ();
  200. static int consec_sets_invariant_p ();
  201. static int can_jump_into_range_p ();
  202. static int labels_in_range_p ();
  203. static void count_loop_regs_set ();
  204. static void note_addr_stored ();
  205. static int loop_reg_used_before_p ();
  206. static void constant_high_bytes ();
  207. static void scan_loop ();
  208. static rtx replace_regs ();
  209. static void replace_call_address ();
  210. static rtx skip_consec_insns ();
  211. static void ignore_some_movables ();
  212. static void force_movables ();
  213. static void combine_movables ();
  214. static int rtx_equal_for_loop_p ();
  215. static void move_movables ();
  216. static void strength_reduce ();
  217. static void find_mem_givs ();
  218. static void record_giv ();
  219. static void delete_insn_forces ();
  220. static int basic_induction_var ();
  221. static int general_induction_var ();
  222. static int consec_sets_giv ();
  223. static int check_dbra_loop ();
  224. static void emit_iv_init_code ();
  225. static int product_cheap_p ();
  226. static void emit_iv_inc ();
  227. static void check_eliminate_biv ();
  228. static int can_eliminate_biv_p ();
  229. static void eliminate_biv ();
  230. static rtx final_biv_value ();
  231. static int last_use_this_basic_block ();
  232.  
  233. /* Entry point of this file.  Perform loop optimization
  234.    on the current function.  F is the first insn of the function
  235.    and DUMPFILE is a stream for output of a trace of actions taken
  236.    (or 0 if none should be output).  */
  237.  
  238. void
  239. loop_optimize (f, dumpfile)
  240.      /* f is the first instruction of a chain of insns for one function */
  241.      rtx f;
  242.      FILE *dumpfile;
  243. {
  244.   register rtx insn;
  245.   register int i;
  246.   rtx end;
  247.   rtx last_insn;
  248.  
  249.   loop_dump_stream = dumpfile;
  250.  
  251. #if 0 /* we hate it */
  252.   /* MPW C -m can't deal with this code at all... */
  253.   init_recog ();
  254.  
  255.   old_max_reg = max_reg_num ();
  256.  
  257.   moved_once = (char *) alloca (old_max_reg);
  258.   bzero (moved_once, old_max_reg);
  259.  
  260.   /* First find the last real insn, and count the number of insns,
  261.      and assign insns their luids.  */
  262.  
  263.   for (insn = f, i = 0; insn; insn = NEXT_INSN (insn))
  264.     if (INSN_UID (insn) > i)
  265.       i = INSN_UID (insn);
  266.  
  267.   max_uid = i + 1;
  268.   uid_luid = (int *) alloca ((i + 1) * sizeof (int));
  269.   bzero (uid_luid, (i + 1) * sizeof (int));
  270.  
  271.   /* Compute the mapping from uids to luids.
  272.      LUIDs are numbers assigned to insns, like uids,
  273.      except that luids increase monotonically through the code.
  274.      Don't assign luids to line-number NOTEs, so that the distance in luids
  275.      between two insns is not affected by -g.  */
  276.  
  277.   for (insn = f, i = 0; insn; insn = NEXT_INSN (insn))
  278.     {
  279.       last_insn = insn;
  280.       if (GET_CODE (insn) != NOTE
  281.       || NOTE_LINE_NUMBER (insn) < 0)
  282.     INSN_LUID (insn) = ++i;
  283.       else
  284.     /* Give a line number note the same luid as preceding insn.  */
  285.     INSN_LUID (insn) = i;
  286.     }
  287.  
  288.   max_luid = i;
  289.  
  290.   /* Don't leave gaps in uid_luid for insns that have been
  291.      deleted.  It is possible that the first or last insn
  292.      using some register has been deleted by cross-jumping.
  293.      Make sure that uid_luid for that former insn's uid
  294.      points to the general area where that insn used to be.  */
  295.   for (i = 0; i < max_uid; i++)
  296.     {
  297.       uid_luid[0] = uid_luid[i];
  298.       if (uid_luid[0] != 0)
  299.     break;
  300.     }
  301.   for (i = 0; i < max_uid; i++)
  302.     if (uid_luid[i] == 0)
  303.       uid_luid[i] = uid_luid[i - 1];
  304.  
  305.   /* Find and process each loop.
  306.      We scan from the end, and process each loop when its start is seen,
  307.      so we process innermost loops first.  */
  308.  
  309.   for (insn = last_insn; insn; insn = PREV_INSN (insn))
  310.     if (GET_CODE (insn) == NOTE
  311.     && NOTE_LINE_NUMBER (insn) == NOTE_INSN_LOOP_BEG)
  312.       {
  313.     /* Make sure it really is a loop -- no jumps in from outside.  */
  314.     end = verify_loop (f, insn);
  315.     if (end != 0)
  316.       /* If so, optimize this loop.  */
  317.       scan_loop (insn, end, max_reg_num ());
  318.     else if (loop_dump_stream)
  319.       fprintf (loop_dump_stream,
  320.            "\nLoop at %d ignored due to multiple entry points.\n",
  321.            INSN_UID (insn));
  322.       }
  323. }
  324.  
  325. /* Optimize one loop whose start is LOOP_START and end is END.
  326.    LOOP_START is the NOTE_INSN_LOOP_BEG and END is the matching
  327.    NOTE_INSN_LOOP_END.  */
  328.  
  329. /* ??? can also move memory writes out of loop if destination
  330.    address is invariant? */
  331.  
  332. static void
  333. scan_loop (loop_start, end, nregs)
  334.      rtx loop_start, end;
  335.      int nregs;
  336. {
  337.   register int i;
  338.   register rtx p = NEXT_INSN (loop_start);
  339.   /* 1 if we are scanning insns that could be executed zero times.  */
  340.   int maybe_never = 0;
  341.   /* 1 if we are scanning insns that might never be executed
  342.      due to a subroutine call which might exit before they are reached.  */
  343.   int call_passed = 0;
  344.   /* For a rotated loop that is entered near the bottom,
  345.      this is the label at the top.  Otherwise it is zero.  */
  346.   rtx loop_top = 0;
  347.   /* Jump insn that enters the loop, or 0 if control drops in.  */
  348.   rtx loop_entry_jump = 0;
  349.   /* Place in the loop where control enters.  */
  350.   rtx scan_start;
  351.   /* Number of insns in the loop.  */
  352.   int insn_count;
  353.   int tem;
  354.   rtx temp;
  355.   /* Indexed by register number, contains 1 for a register whose
  356.      assignments may not be moved out of the loop.  */
  357.   char *may_not_move;
  358.   /* Chain describing insns movable in current loop.  */
  359.   struct movable *movables = 0;
  360.   /* Last element in `movables' -- so we can add elements at the end.  */
  361.   struct movable *last_movable = 0;
  362.   /* Ratio of extra register life span we can justify
  363.      for saving an instruction.  More if loop doesn't call subroutines
  364.      since in that case saving an insn makes more difference
  365.      and more registers are available.  */
  366.   int threshold = loop_has_call ? 15 : 30;
  367.   /* Nonzero if the insn that jumps into the real loop
  368.      is not the very first thing after the loop-beginning note.  */
  369.   int something_before_entry_jump = 0;
  370.  
  371.   n_times_set = (short *) alloca (nregs * sizeof (short));
  372.   n_times_used = (short *) alloca (nregs * sizeof (short));
  373.   may_not_move = (char *) alloca (nregs);
  374.  
  375.   /* Determine whether this loop starts with a jump down
  376.      to a test at the end.  */
  377.   while (p != end
  378.      && GET_CODE (p) != CODE_LABEL && GET_CODE (p) != JUMP_INSN)
  379.     {
  380.       if (GET_CODE (p) == CALL_INSN || GET_CODE (p) == INSN)
  381.     something_before_entry_jump = 1;
  382.       p = NEXT_INSN (p);
  383.     }
  384.  
  385.   /* "Loop" contains neither jumps nor labels;
  386.      it must have been a dummy.  Think no more about it.  */
  387.   if (p == end)
  388.     return;
  389.  
  390.   scan_start = p;
  391.  
  392.   /* If loop has a jump before the first label,
  393.      the true entry is the target of that jump.
  394.      Start scan from there.
  395.      But record in LOOP_TOP the place where the end-test jumps
  396.      back to so we can scan that after the end of the loop.  */
  397.   if (GET_CODE (p) == JUMP_INSN)
  398.     {
  399.       loop_entry_jump = p;
  400.       loop_top = NEXT_INSN (p);
  401.       /* Loop entry will never be a conditional jump.
  402.      If we see one, this must not be a real loop.
  403.      Also, a return-insn isn't a jump to enter the loop.  */
  404.       if (GET_CODE (loop_top) != BARRIER
  405.       || GET_CODE (PATTERN (p)) != SET)
  406.     return;
  407.       /* Get the label at which the loop is entered.  */
  408.       p = XEXP (SET_SRC (PATTERN (p)), 0);
  409.       /* Check to see whether the jump actually
  410.      jumps out of the loop (meaning it's no loop).
  411.      This case can happen for things like
  412.      do {..} while (0).  */
  413.       if (p == 0
  414.       || INSN_LUID (p) < INSN_LUID (loop_start)
  415.       || INSN_LUID (p) >= INSN_LUID (end))
  416.     {
  417.       if (loop_dump_stream)
  418.         fprintf (loop_dump_stream, "\nLoop from %d to %d is phony.\n\n",
  419.              INSN_UID (loop_start), INSN_UID (end));
  420.       return;
  421.     }
  422.  
  423.       /* Find the first label after the entry-jump.  */
  424.       while (GET_CODE (loop_top) != CODE_LABEL)
  425.     {
  426.       loop_top = NEXT_INSN (loop_top);
  427.       if (loop_top == 0)
  428.         abort ();
  429.     }
  430.  
  431.       /* Maybe rearrange the loop to drop straight in
  432.      with a new test to jump around it entirely.
  433.      (The latter is considered outside the loop.)
  434.      If this is done, we no longer enter with a jump.  */
  435.       if (! something_before_entry_jump
  436.       && loop_skip_over (loop_start, end, loop_entry_jump))
  437.     {
  438.       scan_start = loop_top;
  439.       loop_top = 0;
  440.     }
  441.       else
  442.     /* We really do enter with a jump;
  443.        scan the loop from the place where the jump jumps to.  */
  444.     scan_start = p;
  445.     }
  446.  
  447.   /* Count number of times each reg is set during this loop.
  448.      Set MAY_NOT_MOVE[I] if it is not safe to move out
  449.      the setting of register I.  */
  450.  
  451.   bzero (n_times_set, nregs * sizeof (short));
  452.   bzero (may_not_move, nregs);
  453.   count_loop_regs_set (loop_top ? loop_top : loop_start, end,
  454.                may_not_move, &insn_count, nregs);
  455.   for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
  456.     may_not_move[i] = 1, n_times_set[i] = 1;
  457.   bcopy (n_times_set, n_times_used, nregs * sizeof (short));
  458.  
  459.   if (loop_dump_stream)
  460.     {
  461.       fprintf (loop_dump_stream, "\nLoop from %d to %d: %d real insns.\n",
  462.            INSN_UID (loop_start), INSN_UID (end), insn_count);
  463.       if (loop_continue)
  464.     fprintf (loop_dump_stream, "Continue at insn %d.\n",
  465.          INSN_UID (loop_continue));
  466.     }
  467.  
  468.   /* Scan through the loop finding insns that are safe to move.
  469.      In each such insn, store QImode as the mode, to mark it.
  470.      Then set n_times_set to -1 for the reg being set, so that
  471.      this reg will be considered invariant for subsequent insns.
  472.      We consider whether subsequent insns use the reg
  473.      in deciding whether it is worth actually moving.
  474.  
  475.      MAYBE_NEVER is nonzero if we have passed a conditional jump insn
  476.      and therefore it is possible that the insns we are scanning
  477.      would never be executed.  At such times, we must make sure
  478.      that it is safe to execute the insn once instead of zero times.
  479.      When MAYBE_NEVER is 0, all insns will be executed at least once
  480.      so that is not a problem.  */
  481.  
  482.   p = scan_start;
  483.   while (1)
  484.     {
  485.       p = NEXT_INSN (p);
  486.       /* At end of a straight-in loop, we are done.
  487.      At end of a loop entered at the bottom, scan the top.  */
  488.       if (p == scan_start)
  489.     break;
  490.       if (p == end)
  491.     {
  492.       if (loop_top != 0)
  493.         p = NEXT_INSN (loop_top);
  494.       else
  495.         break;
  496.       if (p == scan_start)
  497.         break;
  498.     }
  499.       if (GET_CODE (p) == INSN
  500.       && GET_CODE (PATTERN (p)) == SET
  501.       && GET_CODE (SET_DEST (PATTERN (p))) == REG
  502.       && ! may_not_move[REGNO (SET_DEST (PATTERN (p)))])
  503.     {
  504.       int tem1 = 0;
  505.       /* Don't try to optimize a register that was made
  506.          by loop-optimization for an inner loop.
  507.          We don't know its life-span, so we can't compute the benefit.  */
  508.       if (REGNO (SET_DEST (PATTERN (p))) >= old_max_reg)
  509.         ;
  510.       /* If this register is used or set outside the loop,
  511.          then we can move it only if we know this insn is
  512.          executed exactly once per iteration,
  513.          and we can check all the insns executed before it
  514.          to make sure none of them used the value that
  515.          was lying around at entry to the loop.  */
  516.       else if ((uid_luid[regno_last_uid[REGNO (SET_DEST (PATTERN (p)))]] > INSN_LUID (end)
  517.             || uid_luid[regno_first_uid[REGNO (SET_DEST (PATTERN (p)))]] < INSN_LUID (loop_start))
  518.            && (maybe_never
  519.                || loop_reg_used_before_p (p, loop_start, scan_start, end)))
  520.         ;
  521.       else if (((tem = invariant_p (SET_SRC (PATTERN (p))))
  522.             || ((temp = find_reg_note (p, REG_EQUAL, 0)) 
  523.             && (tem = invariant_p (XEXP (temp, 0)))))
  524.            && (n_times_set[REGNO (SET_DEST (PATTERN (p)))] == 1
  525.                || (tem1
  526.                = consec_sets_invariant_p (SET_DEST (PATTERN (p)),
  527.                               n_times_set[REGNO (SET_DEST (PATTERN (p)))],
  528.                               p)))
  529.            /* If the insn can cause a trap (such as divide by zero),
  530.               can't move it unless it's guaranteed to be executed
  531.               once loop is entered.  Even a function call might
  532.               prevent the trap insn from being reached
  533.               (since it might exit!)  */
  534.            && ! ((maybe_never || call_passed)
  535.              && (may_trap_p (SET_SRC (PATTERN (p)))
  536.                  || ((temp = find_reg_note (p, REG_EQUAL, 0))
  537.                  && may_trap_p (XEXP (temp, 0))))))
  538.         {
  539.           register struct movable *m;
  540.           register int regno = REGNO (SET_DEST (PATTERN (p)));
  541.           int count;
  542.           m = (struct movable *) alloca (sizeof (struct movable));
  543.           m->next = 0;
  544.           m->insn = p;
  545.           temp = find_reg_note (p, REG_EQUAL, 0);
  546.           if (temp)
  547.         m->set_src = XEXP (temp, 0);
  548.           else
  549.         m->set_src = SET_SRC (PATTERN (p));
  550.           m->force = 0;
  551.           m->consec = n_times_set[REGNO (SET_DEST (PATTERN (p)))] - 1;
  552.           m->done = 0;
  553.           m->forces = 0;
  554.           m->partial = 0;
  555.           m->savemode = VOIDmode;
  556.           m->regno = regno;
  557.           /* Set M->cond if either invariant_p or consec_sets_invariant_p
  558.          returned 2 (only conditionally invariant).  */
  559.           m->cond = ((tem | tem1) > 1);
  560.           m->global = (uid_luid[regno_last_uid[regno]] > INSN_LUID (end)
  561.                || uid_luid[regno_first_uid[regno]] < INSN_LUID (loop_start));
  562.           m->match = 0;
  563.           m->lifetime = (uid_luid[regno_last_uid[regno]]
  564.                  - uid_luid[regno_first_uid[regno]]);
  565.           m->savings = n_times_used[regno];
  566.           n_times_set[regno] = -1;
  567.           /* Add M to the end of the chain MOVABLES.  */
  568.           if (movables == 0)
  569.         movables = m;
  570.           else
  571.         last_movable->next = m;
  572.           last_movable = m;
  573.           if (m->consec > 0)
  574.         {
  575.           /* Skip this insn, not checking REG_LIBCALL notes.  */
  576.           p = NEXT_INSN (p);
  577.           /* Skip the consecutive insns, if there are any.  */
  578.           p = skip_consec_insns (p, m->consec);
  579.           /* Back up, so the main loop will advance to the right place.  */
  580.           p = PREV_INSN (p);
  581.         }
  582.         }
  583.       /* If this register is always set within a STRICT_LOW_PART
  584.          or set to zero, then its high bytes are constant.
  585.          So clear them outside the loop and within the loop
  586.          just load the low bytes.
  587.          We must check that the machine has an instruction to do so.
  588.          Also, if the value loaded into the register
  589.          depends on the same register, this cannot be done.  */
  590.       else if (SET_SRC (PATTERN (p)) == const0_rtx
  591.            && GET_CODE (NEXT_INSN (p)) == INSN
  592.            && GET_CODE (PATTERN (NEXT_INSN (p))) == SET
  593.            && (GET_CODE (SET_DEST (PATTERN (NEXT_INSN (p))))
  594.                == STRICT_LOW_PART)
  595.            && (GET_CODE (XEXP (SET_DEST (PATTERN (NEXT_INSN (p))), 0))
  596.                == SUBREG)
  597.            && (SUBREG_REG (XEXP (SET_DEST (PATTERN (NEXT_INSN (p))), 0))
  598.                == SET_DEST (PATTERN (p)))
  599.            && !reg_mentioned_p (SET_DEST (PATTERN (p)),
  600.                     SET_SRC (PATTERN (NEXT_INSN (p)))))
  601.         {
  602.           register int regno = REGNO (SET_DEST (PATTERN (p)));
  603.           if (n_times_set[regno] == 2)
  604.         {
  605.           register struct movable *m;
  606.           int count;
  607.           m = (struct movable *) alloca (sizeof (struct movable));
  608.           m->next = 0;
  609.           m->insn = p;
  610.           m->force = 0;
  611.           m->consec = 0;
  612.           m->done = 0;
  613.           m->forces = 0;
  614.           m->partial = 1;
  615.           /* If the insn may not be executed on some cycles,
  616.              we can't clear the whole reg; clear just high part.
  617.              Not even if the reg is used only within this loop.
  618.              Consider this:
  619.              while (1)
  620.                while (s != t) {
  621.                  if (foo ()) x = *s;
  622.              use (x);
  623.                }
  624.              Clearing x before the inner loop could clobber a value
  625.              being saved from the last time around the outer loop.
  626.              However, if the reg is not used outside this loop
  627.              and all uses of the register are in the same
  628.              basic block as the store, there is no problem.  */
  629.           m->global = (uid_luid[regno_last_uid[regno]] > INSN_LUID (end)
  630.                    || uid_luid[regno_first_uid[regno]] < INSN_LUID (p)
  631.                    || (labels_in_range_p
  632.                    (p, uid_luid[regno_first_uid[regno]])));
  633.           if (maybe_never && m->global)
  634.             m->savemode = GET_MODE (SET_SRC (PATTERN (NEXT_INSN (p))));
  635.           else
  636.             m->savemode = VOIDmode;
  637.           m->regno = regno;
  638.           m->cond = 0;
  639.           m->match = 0;
  640.           m->lifetime = (uid_luid[regno_last_uid[regno]]
  641.                  - uid_luid[regno_first_uid[regno]]);
  642.           m->savings = 1;
  643.           n_times_set[regno] = -1;
  644.           /* Add M to the end of the chain MOVABLES.  */
  645.           if (movables == 0)
  646.             movables = m;
  647.           else
  648.             last_movable->next = m;
  649.           last_movable = m;
  650.         }
  651.         }
  652.     }
  653.       /* Past a call insn, we get to insns which might not be executed
  654.      because the call might exit.  This matters for insns that trap.  */
  655.       else if (GET_CODE (p) == CALL_INSN)
  656.     call_passed = 1;
  657.       /* Past a label or a jump, we get to insns for which we
  658.      can't count on whether or how many times they will be
  659.      executed during each iteration.  Therefore, we can
  660.      only move out sets of trivial variables
  661.      (those not used after the loop).  */
  662.       else if ((GET_CODE (p) == CODE_LABEL || GET_CODE (p) == JUMP_INSN)
  663.            /* If we enter the loop in the middle, and scan around
  664.           to the beginning, don't set maybe_never for that.  */
  665.                && ! (NEXT_INSN (p) == end && GET_CODE (p) == JUMP_INSN
  666.                      && simplejump_p (p)))
  667.     maybe_never = 1;
  668.     }
  669.  
  670.   /* If one movable subsumes another, ignore that other.  */
  671.  
  672.   ignore_some_movables (movables);
  673.  
  674.   /* For each movable insn, see if the reg that it loads
  675.      leads when it dies right into another conditionally movable insn.
  676.      If so, record that the second insn "forces" the first one,
  677.      since the second can be moved only if the first is.  */
  678.  
  679.   force_movables (movables);
  680.  
  681.   /* See if there are multiple movable insns that load the same value.
  682.      If there are, make all but the first point at the first one
  683.      through the `match' field, and add the priorities of them
  684.      all together as the priority of the first.  */
  685.  
  686.   combine_movables (movables, nregs);
  687.     
  688.   /* Now consider each movable insn to decide whether it is worth moving.
  689.      Store 0 in n_times_set for each reg that is moved.  */
  690.  
  691.   move_movables (movables, threshold,
  692.          insn_count, loop_start, end, nregs);
  693.  
  694.   /* Now candidates that still have -1 are those not moved.
  695.      Change n_times_set to indicate that those are not actually invariant.  */
  696.   for (i = 0; i < nregs; i++)
  697.     if (n_times_set[i] < 0)
  698.       n_times_set[i] = n_times_used[i];
  699.  
  700.   if (flag_strength_reduce)
  701.     strength_reduce (scan_start, end, loop_top,
  702.              insn_count, loop_start, end, nregs);
  703. }
  704.  
  705. /* Skip COUNT insns from INSN, counting library calls as 1 insn.  */
  706.  
  707. static rtx
  708. skip_consec_insns (insn, count)
  709.      rtx insn;
  710.      int count;
  711. {
  712.   for (; count > 0; count--)
  713.     {
  714.       if (GET_CODE (insn) == NOTE)
  715.     insn = NEXT_INSN (insn);
  716.       else if (GET_CODE (insn) == BARRIER || GET_CODE (insn) == CODE_LABEL)
  717.     abort ();
  718.       else
  719.     {
  720.       rtx i1, temp;
  721.  
  722.       /* If first insn of gnulib call sequence, skip to end.  */
  723.       /* Do this at start of loop, since INSN is guaranteed to 
  724.          be an insn here.  */
  725.       if (temp = find_reg_note (insn, REG_LIBCALL, 0))
  726.         insn = XEXP (temp, 0);
  727.  
  728.       do insn = NEXT_INSN (insn);
  729.       while (GET_CODE (insn) == NOTE);
  730.     }
  731.     }
  732.  
  733.   return insn;
  734. }
  735.  
  736. /* Ignore any movable whose insn falls within a libcall
  737.    which is part of another movable.
  738.    We make use of the fact that the movable for the libcall value
  739.    was made later and so appears later on the chain.  */
  740.  
  741. static void
  742. ignore_some_movables (movables)
  743.      struct movable *movables;
  744. {
  745.   register struct movable *m, *m1;
  746.  
  747.   for (m = movables; m; m = m->next)
  748.     {
  749.       /* Is this a movable for the value of a libcall?  */
  750.       rtx note = find_reg_note (m->insn, REG_RETVAL, 0);
  751.       if (note)
  752.     {
  753.       /* Find the beginning of that libcall.  */
  754.       rtx first_insn = XEXP (note, 0);
  755.       /* Check for earlier movables inside that range,
  756.          and mark them invalid.  */
  757.       for (m1 = movables; m1 != m; m1 = m1->next)
  758.         if (INSN_LUID (m1->insn) >= INSN_LUID (first_insn)
  759.         && INSN_LUID (m1->insn) < INSN_LUID (m->insn))
  760.           m1->done = 1;
  761.     }
  762.     }
  763. }      
  764.  
  765. /* For each movable insn, see if the reg that it loads
  766.    leads when it dies right into another conditionally movable insn.
  767.    If so, record that the second insn "forces" the first one,
  768.    since the second can be moved only if the first is.  */
  769.  
  770. static void
  771. force_movables (movables)
  772.      struct movable *movables;
  773. {
  774.   register struct movable *m, *m1;
  775.   for (m1 = movables; m1; m1 = m1->next)
  776.     /* Omit this if moving just the (SET (REG) 0) of a zero-extend.  */
  777.     if (!m1->partial && !m1->done)
  778.       {
  779.     int regno = m1->regno;
  780.     for (m = m1->next; m; m = m->next)
  781.       /* ??? Could this be a bug?  What if CSE caused the
  782.          register of M1 to be used after this insn?
  783.          Since CSE does not update regno_last_uid,
  784.          this insn M->insn might not be where it dies.
  785.          But very likely this doesn't matter; what matters is
  786.          that M's reg is computed from M1's reg.  */
  787.       if (INSN_UID (m->insn) == regno_last_uid[regno]
  788.           && !m->done)
  789.         break;
  790.     if (m != 0 && m->set_src == SET_DEST (PATTERN (m1->insn)))
  791.       m = 0;
  792.  
  793.     /* Increase the priority of the moving the first insn
  794.        since it permits the second to be moved as well.  */
  795.     if (m != 0)
  796.       {
  797.         m->forces = m1;
  798.         m1->lifetime += m->lifetime;
  799.         m1->savings += m1->savings;
  800.       }
  801.       }
  802. }
  803.  
  804. /* Find invariant expressions that are equal and can be combined into
  805.    one register.  */
  806.  
  807. static void
  808. combine_movables (movables, nregs)
  809.      struct movable *movables;
  810.      int nregs;
  811. {
  812.   register struct movable *m;
  813.   char *matched_regs = (char *) alloca (nregs);
  814.   enum machine_mode mode;
  815.  
  816.   /* Regs that are set more than once are not allowed to match
  817.      or be matched.  I'm no longer sure why not.  */
  818.   /* Perhaps testing m->consec_sets would be more appropriate here?  */
  819.  
  820.   for (m = movables; m; m = m->next)
  821.     if (m->match == 0 && n_times_used[m->regno] == 1 && !m->partial)
  822.       {
  823.     register struct movable *m1;
  824.     int regno = m->regno;
  825.  
  826.     bzero (matched_regs, nregs);
  827.     matched_regs[regno] = 1;
  828.  
  829.     for (m1 = m->next; m1; m1 = m1->next)
  830.       if (m1->match == 0 && n_times_used[m1->regno] == 1
  831.           /* A reg used outside the loop mustn't be eliminated.  */
  832.           && !m1->global
  833.           /* A reg used for zero-extending mustn't be eliminated.  */
  834.           && !m1->partial
  835.           && (matched_regs[m1->regno]
  836.           ||
  837.           (
  838.            /* Can't combine regs with different modes
  839.               even if loaded from the same constant.  */
  840.            (GET_MODE (SET_DEST (PATTERN (m->insn)))
  841.             == GET_MODE (SET_DEST (PATTERN (m1->insn))))
  842.            /* See if the source of M1 says it matches M.  */
  843.            && ((GET_CODE (m1->set_src) == REG
  844.             && matched_regs[REGNO (m1->set_src)])
  845.                || rtx_equal_for_loop_p (m->set_src, m1->set_src,
  846.                         movables)
  847.                || (REG_NOTES (m->insn) && REG_NOTES (m1->insn)
  848.                && REG_NOTE_KIND (REG_NOTES (m->insn)) == REG_EQUIV
  849.                && REG_NOTE_KIND (REG_NOTES (m1->insn)) == REG_EQUIV
  850.                && rtx_equal_p (XEXP (REG_NOTES (m->insn), 0),
  851.                        XEXP (REG_NOTES (m1->insn), 0)))))))
  852.         {
  853.           m->lifetime += m1->lifetime;
  854.           m->savings += m1->savings;
  855.           m1->match = m;
  856.           matched_regs[m1->regno] = 1;
  857.         }
  858.       }
  859.  
  860.   /* Now combine the regs used for zero-extension.
  861.      This can be done for those not marked `global'
  862.      provided their lives don't overlap.  */
  863.  
  864.   for (mode = VOIDmode; (int) mode < (int) MAX_MACHINE_MODE;
  865.        mode = (enum machine_mode) ((int) mode + 1))
  866.     if (GET_MODE_CLASS (mode) == MODE_INT)
  867.       {
  868.     register struct movable *m0 = 0;
  869.  
  870.     /* Combine all the registers for extension from mode MODE.
  871.        Don't combine any that are used outside this loop.  */
  872.     for (m = movables; m; m = m->next)
  873.       if (m->partial && ! m->global
  874.           && mode == GET_MODE (SET_SRC (PATTERN (NEXT_INSN (m->insn)))))
  875.         {
  876.           register struct movable *m1;
  877.           int first = uid_luid[regno_first_uid[m->regno]];
  878.           int last = uid_luid[regno_last_uid[m->regno]];
  879.  
  880.           if (m0 == 0)
  881.         {
  882.           /* First one: don't check for overlap, just record it.  */
  883.           m0 = m;
  884.           continue;
  885.         }
  886.  
  887.           /* Make sure they extend to the same mode.
  888.          (Almost always true.)  */
  889.           if (GET_MODE (SET_DEST (PATTERN (m->insn)))
  890.           != GET_MODE (SET_DEST (PATTERN (m0->insn))))
  891.         continue;
  892.  
  893.           /* We already have one: check for overlap with those
  894.          already combined together.  */
  895.           for (m1 = movables; m1 != m; m1 = m1->next)
  896.         if (m1 == m0 || (m1->partial && m1->match == m0))
  897.           if (! (uid_luid[regno_first_uid[m1->regno]] > last
  898.              || uid_luid[regno_last_uid[m1->regno]] < first))
  899.             goto overlap;
  900.  
  901.           /* No overlap: we can combine this with the others.  */
  902.           m0->lifetime += m->lifetime;
  903.           m0->savings += m->savings;
  904.           m->match = m0;
  905.  
  906.         overlap: ;
  907.         }
  908.       }
  909. }
  910.  
  911. /* Return 1 if regs X and Y will become the same if moved.  */
  912.  
  913. static int
  914. regs_match_p (x, y, movables)
  915.      rtx x, y;
  916.      struct movable *movables;
  917. {
  918.   int xn = REGNO (x);
  919.   int yn = REGNO (y);
  920.   struct movable *mx, *my;
  921.  
  922.   for (mx = movables; mx; mx = mx->next)
  923.     if (mx->regno == xn)
  924.       break;
  925.  
  926.   for (my = movables; my; my = my->next)
  927.     if (my->regno == yn)
  928.       break;
  929.  
  930.   return (mx && my
  931.       && ((mx->match == my->match && mx->match != 0)
  932.           || mx->match == my
  933.           || mx == my->match));
  934. }
  935.  
  936. /* Return 1 if X and Y are identical-looking rtx's.
  937.    This is the Lisp function EQUAL for rtx arguments.  */
  938.  
  939. static int
  940. rtx_equal_for_loop_p (x, y, movables)
  941.      rtx x, y;
  942.      struct movable *movables;
  943. {
  944.   register int i;
  945.   register int j;
  946.   register enum rtx_code code;
  947.   register char *fmt;
  948.  
  949.   if (x == y)
  950.     return 1;
  951.   if (x == 0 || y == 0)
  952.     return 0;
  953.  
  954.   code = GET_CODE (x);
  955.   /* Rtx's of different codes cannot be equal.  */
  956.   if (code != GET_CODE (y))
  957.     return 0;
  958.  
  959.   /* (MULT:SI x y) and (MULT:HI x y) are NOT equivalent.
  960.      (REG:SI x) and (REG:HI x) are NOT equivalent.  */
  961.  
  962.   if (GET_MODE (x) != GET_MODE (y))
  963.     return 0;
  964.  
  965.   /* These three types of rtx's can be compared nonrecursively.  */
  966.   /* Until the end of reload,
  967.      don't consider the a reference to the return register of the current
  968.      function the same as the return from a called function.  This eases
  969.      the job of function integration.  Once the distinction no longer
  970.      matters, the insn will be deleted.  */
  971.   if (code == REG)
  972.     return ((REGNO (x) == REGNO (y)
  973.          && REG_FUNCTION_VALUE_P (x) == REG_FUNCTION_VALUE_P (y))
  974.         || regs_match_p (x, y, movables));
  975.  
  976.   if (code == LABEL_REF)
  977.     return XEXP (x, 0) == XEXP (y, 0);
  978.   if (code == SYMBOL_REF)
  979.     return XSTR (x, 0) == XSTR (y, 0);
  980.  
  981.   /* Compare the elements.  If any pair of corresponding elements
  982.      fail to match, return 0 for the whole things.  */
  983.  
  984.   fmt = GET_RTX_FORMAT (code);
  985.   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
  986.     {
  987.       switch (fmt[i])
  988.     {
  989.     case 'i':
  990.       if (XINT (x, i) != XINT (y, i))
  991.         return 0;
  992.       break;
  993.  
  994.     case 'E':
  995.       /* Two vectors must have the same length.  */
  996.       if (XVECLEN (x, i) != XVECLEN (y, i))
  997.         return 0;
  998.  
  999.       /* And the corresponding elements must match.  */
  1000.       for (j = 0; j < XVECLEN (x, i); j++)
  1001.         if (rtx_equal_for_loop_p (XVECEXP (x, i, j), XVECEXP (y, i, j), movables) == 0)
  1002.           return 0;
  1003.       break;
  1004.  
  1005.     case 'e':
  1006.       if (rtx_equal_for_loop_p (XEXP (x, i), XEXP (y, i), movables) == 0)
  1007.         return 0;
  1008.       break;
  1009.  
  1010.     case 's':
  1011.       if (strcmp (XSTR (x, i), XSTR (y, i)))
  1012.         return 0;
  1013.       break;
  1014.  
  1015.     case 'u':
  1016.       /* These are just backpointers, so they don't matter.  */
  1017.       break;
  1018.  
  1019.     case '0':
  1020.       break;
  1021.  
  1022.       /* It is believed that rtx's at this level will never
  1023.          contain anything but integers and other rtx's,
  1024.          except for within LABEL_REFs and SYMBOL_REFs.  */
  1025.     default:
  1026.       abort ();
  1027.     }
  1028.     }
  1029.   return 1;
  1030. }
  1031.  
  1032. /* Scan MOVABLES, and move the insns that deserve to be moved.
  1033.    If two matching movables are combined, replace one reg with the
  1034.    other throughout.  */
  1035.  
  1036. static void
  1037. move_movables (movables, threshold, insn_count, loop_start, end, nregs)
  1038.      struct movable *movables;
  1039.      int threshold;
  1040.      int insn_count;
  1041.      rtx loop_start;
  1042.      rtx end;
  1043.      int nregs;
  1044. {
  1045.   rtx new_start = 0;
  1046.   register struct movable *m;
  1047.   register rtx p;
  1048.   /* Map of pseudo-register replacements to handle combining
  1049.      when we move several insns that load the same value
  1050.      into different pseudo-registers.  */
  1051.   rtx *reg_map = (rtx *) alloca (nregs * sizeof (rtx));
  1052.   char *already_moved = (char *) alloca (nregs);
  1053.  
  1054.   bzero (already_moved, nregs);
  1055.   bzero (reg_map, nregs * sizeof (rtx));
  1056.  
  1057.   num_movables = 0;
  1058.  
  1059.   for (m = movables; m; m = m->next)
  1060.     {
  1061.       /* Describe this movable insn.  */
  1062.  
  1063.       if (loop_dump_stream)
  1064.     {
  1065.       fprintf (loop_dump_stream, "Insn %d: regno %d (life %d), ",
  1066.            INSN_UID (m->insn), m->regno, m->lifetime);
  1067.       if (m->consec > 0)
  1068.         fprintf (loop_dump_stream, "consec %d, ", m->consec);
  1069.       if (m->cond)
  1070.         fprintf (loop_dump_stream, "cond ");
  1071.       if (m->force)
  1072.         fprintf (loop_dump_stream, "force ");
  1073.       if (m->global)
  1074.         fprintf (loop_dump_stream, "global ");
  1075.       if (m->done)
  1076.         fprintf (loop_dump_stream, "done ");
  1077.       if (m->match)
  1078.         fprintf (loop_dump_stream, "matches %d ",
  1079.              INSN_UID (m->match->insn));
  1080.       if (m->forces)
  1081.         fprintf (loop_dump_stream, "forces %d ",
  1082.              INSN_UID (m->forces->insn));
  1083.     }
  1084.  
  1085.       /* Count movables.  Value used in heuristics in strength_reduce.  */
  1086.       num_movables++;
  1087.  
  1088.       /* Ignore the insn if it's already done (it matched something else).
  1089.      Otherwise, see if it is now safe to move.  */
  1090.  
  1091.       if (!m->done
  1092.       && (! m->cond
  1093.           || (1 == invariant_p (m->set_src)
  1094.           && (m->consec == 0
  1095.               || 1 == consec_sets_invariant_p (SET_DEST (PATTERN (m->insn)),
  1096.                                m->consec + 1,
  1097.                                m->insn))))
  1098.       && (! m->forces || m->forces->done))
  1099.     {
  1100.       register int regno;
  1101.       register rtx p;
  1102.       int savings = m->savings;
  1103.  
  1104.       /* We have an insn that is safe to move.
  1105.          Compute its desirability.  */
  1106.  
  1107.       p = m->insn;
  1108.       regno = m->regno;
  1109.  
  1110.       if (loop_dump_stream)
  1111.         fprintf (loop_dump_stream, "savings %d ", savings);
  1112.  
  1113.       if (moved_once[regno])
  1114.         {
  1115.           insn_count *= 2;
  1116.  
  1117.           if (loop_dump_stream)
  1118.         fprintf (loop_dump_stream, "halved since already moved ");
  1119.         }
  1120.  
  1121.       /* An insn MUST be moved if we already moved something else
  1122.          which is safe only if this one is moved too: that is,
  1123.          if already_moved[REGNO] is nonzero.  */
  1124.  
  1125.       /* An insn is desirable to move if the new lifetime of the
  1126.          register is no more than THRESHOLD times the old lifetime.
  1127.          If it's not desirable, it means the loop is so big
  1128.          that moving won't speed things up much,
  1129.          and it is liable to make register usage worse.  */
  1130.  
  1131.       /* It is also desirable to move if it can be moved at no
  1132.          extra cost because something else was already moved.  */
  1133.  
  1134.       if (already_moved[regno]
  1135.           || (threshold * savings * m->lifetime) >= insn_count
  1136.           || (m->forces && m->forces->done
  1137.           && n_times_used[m->forces->regno] == 1))
  1138.         {
  1139.           int count;
  1140.           register struct movable *m1;
  1141.           rtx first;
  1142.  
  1143.           /* Now move the insns that set the reg.  */
  1144.  
  1145.           for (count = m->consec; count >= 0; count--)
  1146.         {
  1147.           rtx i1, temp;
  1148.  
  1149.           /* If first insn of gnulib call sequence, skip to end.  */
  1150.           /* Do this at start of loop, since p is guaranteed to 
  1151.              be an insn here.  */
  1152.           if (temp = find_reg_note (p, REG_LIBCALL, 0))
  1153.             p = XEXP (temp, 0);
  1154.           
  1155.           /* If last insn of gnulib call sequence, move all
  1156.              insns except the last before the loop.  The last insn is
  1157.              handled in the normal manner.  */
  1158.           if (temp = find_reg_note (p, REG_RETVAL
  1159.                         , 0))
  1160.             {
  1161.               rtx fn_address = 0;
  1162.               rtx fn_reg = 0;
  1163.               first = 0;
  1164.               for (temp = XEXP (temp, 0); temp != p;
  1165.                temp = NEXT_INSN (temp))
  1166.             {
  1167.               rtx body = PATTERN (temp);
  1168.               rtx n;
  1169.               /* Extract the function address from the insn
  1170.                  that loads it into a register.
  1171.                  If this insn was cse'd, we get incorrect code.
  1172.                  So delete it and stick the fn address right
  1173.                  into the call insn.  Since the moved insns
  1174.                  won't be cse'd, that does no harm.  */
  1175.               if (GET_CODE (NEXT_INSN (temp)) == CALL_INSN
  1176.                   && GET_CODE (body) == SET
  1177.                   && GET_CODE (SET_DEST (body)) == REG
  1178.                   && (n = find_reg_note (temp, REG_EQUIV, 0)))
  1179.                 {
  1180.                   fn_reg = SET_SRC (body);
  1181.                   if (GET_CODE (fn_reg) != REG)
  1182.                 fn_reg = SET_DEST (body);
  1183.                   fn_address = XEXP (n, 0);
  1184.                   continue;
  1185.                 }
  1186.               /* We have the call insn.
  1187.                  Substitute the fn address for the reg
  1188.                  that we believe this insn will use.  */
  1189.               if (GET_CODE (temp) == CALL_INSN
  1190.                   && fn_address != 0)
  1191.                 replace_call_address (body, fn_reg, fn_address);
  1192.               if (GET_CODE (temp) == CALL_INSN)
  1193.                 i1 = emit_call_insn_before (body, loop_start);
  1194.               else
  1195.                 i1 = emit_insn_before (body, loop_start);
  1196.               if (first == 0)
  1197.                 first = i1;
  1198.               REG_NOTES (i1) = REG_NOTES (temp);
  1199.               delete_insn (temp);
  1200.             }
  1201.             }
  1202.           if (m->savemode != VOIDmode)
  1203.             {
  1204.               /* P sets REG to zero; but we should clear only the bits
  1205.              that are not covered by the mode m->savemode.  */
  1206.               rtx reg = SET_DEST (PATTERN (p));
  1207.               i1 = emit_insn_before
  1208.             (gen_rtx (SET, VOIDmode, reg,
  1209.                   gen_rtx (AND, GET_MODE (reg),
  1210.                        reg,
  1211.                        gen_rtx (CONST_INT, VOIDmode,
  1212.                             (1 << GET_MODE_BITSIZE (m->savemode)) - 1))),
  1213.              loop_start);
  1214.             }
  1215.           else if (GET_CODE (PATTERN (p)) == CALL_INSN)
  1216.             i1 = emit_call_insn_before (PATTERN (p), loop_start);
  1217.           else
  1218.             i1 = emit_insn_before (PATTERN (p), loop_start);
  1219.  
  1220.           if (new_start == 0)
  1221.             new_start = i1;
  1222.  
  1223.           if (loop_dump_stream)
  1224.             fprintf (loop_dump_stream, " moved to %d", INSN_UID (i1));
  1225.  
  1226.           /* Mark the moved, invariant reg as being equivalent to
  1227.              its constant value.  */
  1228.           REG_NOTES (i1) = REG_NOTES (p);
  1229.           if (REG_NOTES (i1) == 0
  1230.               && ! m->partial /* But not if it's a zero-extend clr. */
  1231.               && ! m->global /* and not if used outside the loop
  1232.                     (since it might get set outside).  */
  1233.               && CONSTANT_P (SET_SRC (PATTERN (p))))
  1234.             REG_NOTES (i1)
  1235.               = gen_rtx (EXPR_LIST, REG_EQUIV,
  1236.                  SET_SRC (PATTERN (p)), REG_NOTES (i1));
  1237.  
  1238.           /* If library call, now fix the REG_NOTES that contain
  1239.              insn pointers, namely REG_LIBCALL on FIRST
  1240.              and REG_RETVAL on I1.  */
  1241.           if (temp = find_reg_note (i1, REG_RETVAL, 0))
  1242.             {
  1243.               XEXP (temp, 0) = first;
  1244.               temp = find_reg_note (first, REG_LIBCALL, 0);
  1245.               XEXP (temp, 0) = i1;
  1246.             }
  1247.  
  1248.           delete_insn (p);
  1249.           do p = NEXT_INSN (p);
  1250.           while (GET_CODE (p) == NOTE);
  1251.         }
  1252.  
  1253.           /* The more regs we move, the less we like moving them.  */
  1254.           threshold -= 3;
  1255.  
  1256.           /* Any other movable that loads the same register
  1257.          MUST be moved.  */
  1258.           already_moved[regno] = 1;
  1259.  
  1260.           /* This reg has been moved out of one loop.  */
  1261.           moved_once[regno] = 1;
  1262.  
  1263.           /* The reg set here is now invariant.  */
  1264.           if (! m->partial)
  1265.         n_times_set[regno] = 0;
  1266.  
  1267.           m->done = 1;
  1268.  
  1269.           /* Change the length-of-life info for the register
  1270.          to say it lives at least the full length of this loop.
  1271.          This will help guide optimizations in outer loops.  */
  1272.  
  1273.           if (uid_luid[regno_first_uid[regno]] > INSN_LUID (loop_start))
  1274.         /* This is the old insn before all the moved insns.
  1275.            We can't use the moved insn because it is out of range
  1276.            in uid_luid.  Only the old insns have luids.  */
  1277.         regno_first_uid[regno] = INSN_UID (loop_start);
  1278.           if (uid_luid[regno_last_uid[regno]] < INSN_LUID (end))
  1279.         regno_last_uid[regno] = INSN_UID (end);
  1280.  
  1281.           /* Combine with this moved insn any other matching movables.  */
  1282.  
  1283.           for (m1 = m->next; m1; m1 = m1->next)
  1284.         if (m1->match == m)
  1285.           {
  1286.             rtx temp;
  1287.  
  1288.             /* Schedule the reg loaded by M1
  1289.                for replacement so that shares the reg of M.  */
  1290.             reg_map[m1->regno] = SET_DEST (PATTERN (m->insn));
  1291.             /* Get rid of the matching insn
  1292.                and prevent further processing of it.  */
  1293.             m1->done = 1;
  1294.  
  1295.             /* if library call, delete all insn except last, which
  1296.                is deleted below */
  1297.             if (temp = find_reg_note (m1->insn, REG_RETVAL, 0))
  1298.               {
  1299.             for (temp = XEXP (temp, 0); temp != m1->insn;
  1300.                  temp = NEXT_INSN (temp))
  1301.                 delete_insn (temp);
  1302.               }
  1303.             delete_insn (m1->insn);
  1304.  
  1305.             /* Any other movable that loads the same register
  1306.                MUST be moved.  */
  1307.             already_moved[m1->regno] = 1;
  1308.  
  1309.             /* The reg merged here is now invariant,
  1310.                if the reg it matches is invariant.  */
  1311.             if (! m->partial)
  1312.               n_times_set[m1->regno] = 0;
  1313.           }
  1314.         }
  1315.       else if (loop_dump_stream)
  1316.         fprintf (loop_dump_stream, "not desirable");
  1317.     }
  1318.       else if (loop_dump_stream && !m->match)
  1319.     fprintf (loop_dump_stream, "not safe");
  1320.  
  1321.       if (loop_dump_stream)
  1322.     fprintf (loop_dump_stream, "\n");
  1323.     }
  1324.  
  1325.   if (new_start == 0)
  1326.     new_start = loop_start;
  1327.  
  1328.   /* Go through all the instructions in the loop, making
  1329.      all the register substitutions scheduled in REG_MAP.  */
  1330.   for (p = new_start; p != end; p = NEXT_INSN (p))
  1331.     if (GET_CODE (p) == INSN || GET_CODE (p) == JUMP_INSN
  1332.     || GET_CODE (p) == CALL_INSN)
  1333.       replace_regs (PATTERN (p), reg_map, nregs);
  1334. }
  1335.  
  1336. /* Optionally change a loop which enters just before the endtest
  1337.    to one which falls straight in
  1338.    after skipping around the entire loop if the endtest would drop out.
  1339.    Returns 1 if the change was made, 0 if the loop was not really suitable.  */
  1340.  
  1341. int
  1342. loop_skip_over (start, end, loop_entry_jump)
  1343.      rtx start;
  1344.      rtx end;
  1345.      rtx loop_entry_jump;
  1346. {
  1347.   rtx entry_insn;
  1348.   rtx endtest;
  1349.   rtx endtestjump;
  1350.   register rtx p = JUMP_LABEL (loop_entry_jump);
  1351.  
  1352.   while (GET_CODE (p) != INSN && GET_CODE (p) != JUMP_INSN
  1353.      && GET_CODE (p) != CALL_INSN)
  1354.     p = NEXT_INSN (p);
  1355.   entry_insn = p;
  1356.  
  1357.   /* Skip any ordinary arithmetic insns to find the compare.  */
  1358.   for (; p != 0; p = NEXT_INSN (p))
  1359.     if (GET_CODE (p) != NOTE)
  1360.       if (GET_CODE (p) != INSN || sets_cc0_p (PATTERN (p)))
  1361.     break;
  1362.   if (p == 0 || GET_CODE (p) != INSN)
  1363.     return 0;
  1364.   endtest = p;
  1365.   endtestjump = next_real_insn (p);
  1366.  
  1367.   /* Check that (1) we have reached a compare insn and (2)
  1368.      the insn (presumably a jump) following that compare
  1369.      is the last in the loop and jumps back to the loop beginning.  */
  1370.  
  1371.   if (sets_cc0_p (PATTERN (endtest)) > 0
  1372.       && endtestjump == prev_real_insn (end)
  1373.       && prev_real_insn (JUMP_LABEL (endtestjump)) == loop_entry_jump)
  1374.     {
  1375.       rtx newlab;
  1376.       /* This is the jump that we insert.  */
  1377.       rtx new_jump;
  1378.  
  1379.       /* Duplicate the ordinary arith insns before the compare.  */
  1380.       for (p = entry_insn; p != endtest; p = NEXT_INSN (p))
  1381.     if (GET_CODE (p) == INSN)
  1382.       {
  1383.         rtx new = emit_insn_before (copy_rtx (PATTERN (p)), start);
  1384.         if (REG_NOTES (p))
  1385.           REG_NOTES (new) = copy_rtx (REG_NOTES (p));
  1386.       }
  1387.     
  1388.       /* Ok, duplicate that test before start of loop.  */
  1389.       emit_insn_before (copy_rtx (PATTERN (endtest)), start);
  1390.       /* Make a new entry-jump (before the original one)
  1391.      whose condition is opposite to the loop-around endtest
  1392.      and which jumps around the loop (to just after the ending NOTE).  */
  1393.       newlab = gen_label_rtx ();
  1394.       emit_label_after (newlab, end);
  1395.       emit_jump_insn_before (copy_rtx (PATTERN (endtestjump)), start);
  1396.       new_jump = PREV_INSN (start);
  1397.       JUMP_LABEL (new_jump) = JUMP_LABEL (endtestjump);
  1398.       LABEL_NUSES (JUMP_LABEL (endtestjump))++;
  1399.       invert_jump (new_jump, newlab);
  1400.       /* Delete the original entry-jump.  */
  1401.       delete_insn (loop_entry_jump);
  1402.  
  1403.       return 1;
  1404.     }
  1405.  
  1406.   return 0;
  1407. }
  1408.  
  1409. /* Throughout the rtx X, replace many registers according to REG_MAP.
  1410.    Return the replacement for X (which may be X with altered contents).
  1411.    REG_MAP[R] is the replacement for register R, or 0 for don't replace.
  1412.    NREGS is the length of REG_MAP; regs >= NREGS are not mapped.  */
  1413.  
  1414. static rtx
  1415. replace_regs (x, reg_map, nregs)
  1416.      rtx x;
  1417.      rtx *reg_map;
  1418.      int nregs;
  1419. {
  1420.   register enum rtx_code code;
  1421.   register int i;
  1422.   register char *fmt;
  1423.  
  1424.   if (x == 0)
  1425.     return x;
  1426.  
  1427.   code = GET_CODE (x);
  1428.   switch (code)
  1429.     {
  1430.     case PC:
  1431.     case CC0:
  1432.     case CONST_INT:
  1433.     case CONST_DOUBLE:
  1434.     case CONST:
  1435.     case SYMBOL_REF:
  1436.     case LABEL_REF:
  1437.       return x;
  1438.  
  1439.     case REG:
  1440.       /* Verify that the register has an entry before trying to access it.  */
  1441.       if (REGNO (x) < nregs && reg_map[REGNO (x)] != 0)
  1442.     return reg_map[REGNO (x)];
  1443.       return x;
  1444.     }
  1445.  
  1446.   fmt = GET_RTX_FORMAT (code);
  1447.   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
  1448.     {
  1449.       if (fmt[i] == 'e')
  1450.     XEXP (x, i) = replace_regs (XEXP (x, i), reg_map, nregs);
  1451.       if (fmt[i] == 'E')
  1452.     {
  1453.       register int j;
  1454.       for (j = 0; j < XVECLEN (x, i); j++)
  1455.         XVECEXP (x, i, j) = replace_regs (XVECEXP (x, i, j), reg_map, nregs);
  1456.     }
  1457.     }
  1458.   return x;
  1459. }
  1460.  
  1461. /* Scan X and replace the address of any MEM in it with ADDR.
  1462.    REG is the address that MEM should have before the replacement.  */
  1463.  
  1464. static void
  1465. replace_call_address (x, reg, addr)
  1466.      rtx x, reg, addr;
  1467. {
  1468.   register enum rtx_code code;
  1469.   register int i;
  1470.   register char *fmt;
  1471.  
  1472.   if (x == 0)
  1473.     return;
  1474.   code = GET_CODE (x);
  1475.   switch (code)
  1476.     {
  1477.     case PC:
  1478.     case CC0:
  1479.     case CONST_INT:
  1480.     case CONST_DOUBLE:
  1481.     case CONST:
  1482.     case SYMBOL_REF:
  1483.     case LABEL_REF:
  1484.     case REG:
  1485.       return;
  1486.  
  1487.     case SET:
  1488.       /* Short cut for very common case.  */
  1489.       replace_call_address (XEXP (x, 1), reg, addr);
  1490.       return;
  1491.  
  1492.     case CALL:
  1493.       /* Short cut for very common case.  */
  1494.       replace_call_address (XEXP (x, 0), reg, addr);
  1495.       return;
  1496.  
  1497.     case MEM:
  1498.       /* If this MEM uses a reg other than the one we expected,
  1499.      something is wrong.  */
  1500.       if (XEXP (x, 0) != reg)
  1501.     abort ();
  1502.       XEXP (x, 0) = addr;
  1503.       return;
  1504.     }
  1505.  
  1506.   fmt = GET_RTX_FORMAT (code);
  1507.   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
  1508.     {
  1509.       if (fmt[i] == 'e')
  1510.     replace_call_address (XEXP (x, i), reg, addr);
  1511.       if (fmt[i] == 'E')
  1512.     {
  1513.       register int j;
  1514.       for (j = 0; j < XVECLEN (x, i); j++)
  1515.         replace_call_address (XVECEXP (x, i, j), reg, addr);
  1516.     }
  1517.     }
  1518. }
  1519.  
  1520. /* Return the number of memory refs to addresses that vary
  1521.    in the rtx X.  */
  1522.  
  1523. static int
  1524. count_nonfixed_reads (x)
  1525.      rtx x;
  1526. {
  1527.   register enum rtx_code code;
  1528.   register int i;
  1529.   register char *fmt;
  1530.   int value;
  1531.  
  1532.   if (x == 0)
  1533.     return 0;
  1534.  
  1535.   code = GET_CODE (x);
  1536.   switch (code)
  1537.     {
  1538.     case PC:
  1539.     case CC0:
  1540.     case CONST_INT:
  1541.     case CONST_DOUBLE:
  1542.     case CONST:
  1543.     case SYMBOL_REF:
  1544.     case LABEL_REF:
  1545.     case REG:
  1546.       return 0;
  1547.  
  1548.     case MEM:
  1549.       return rtx_varies_p (XEXP (x, 0)) + count_nonfixed_reads (XEXP (x, 0));
  1550.     }
  1551.  
  1552.   value = 0;
  1553.   fmt = GET_RTX_FORMAT (code);
  1554.   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
  1555.     {
  1556.       if (fmt[i] == 'e')
  1557.     value += count_nonfixed_reads (XEXP (x, i));
  1558.       if (fmt[i] == 'E')
  1559.     {
  1560.       register int j;
  1561.       for (j = 0; j < XVECLEN (x, i); j++)
  1562.         value += count_nonfixed_reads (XVECEXP (x, i, j));
  1563.     }
  1564.     }
  1565.   return value;
  1566. }
  1567.  
  1568.  
  1569. #if 0
  1570. /* P is an instruction that sets a register to the result of a ZERO_EXTEND.
  1571.    Replace it with an instruction to load just the low bytes
  1572.    if the machine supports such an instruction,
  1573.    and insert above LOOP_START an instruction to clear the register.  */
  1574.  
  1575. static void
  1576. constant_high_bytes (p, loop_start)
  1577.      rtx p, loop_start;
  1578. {
  1579.   register rtx new;
  1580.   register int insn_code_number;
  1581.  
  1582.   /* Try to change (SET (REG ...) (ZERO_EXTEND (..:B ...)))
  1583.      to (SET (STRICT_LOW_PART (SUBREG:B (REG...))) ...).  */
  1584.  
  1585.   new = gen_rtx (SET, VOIDmode,
  1586.          gen_rtx (STRICT_LOW_PART, VOIDmode,
  1587.               gen_rtx (SUBREG, GET_MODE (XEXP (SET_SRC (PATTERN (p)), 0)),
  1588.                    SET_DEST (PATTERN (p)),
  1589.                    0)),
  1590.          XEXP (SET_SRC (PATTERN (p)), 0));
  1591.   insn_code_number = recog (new, p);
  1592.  
  1593.   if (insn_code_number)
  1594.     {
  1595.       register int i;
  1596.  
  1597.       /* Clear destination register before the loop.  */
  1598.       emit_insn_before (gen_rtx (SET, VOIDmode,
  1599.                  SET_DEST (PATTERN (p)),
  1600.                  const0_rtx),
  1601.             loop_start);
  1602.  
  1603.       /* Inside the loop, just load the low part.  */
  1604.       PATTERN (p) = new;
  1605.     }
  1606. }
  1607. #endif
  1608.  
  1609. /* Verify that the ostensible loop starting at START
  1610.    really is a loop: nothing jumps into it from outside.
  1611.    Return the marker for the end of the loop, or zero if not a real loop.
  1612.  
  1613.    Also set the variables `unknown_*_altered' and `loop_has_call',
  1614.    and fill in the array `loop_store_addrs'.  */
  1615.  
  1616. static rtx
  1617. verify_loop (f, start)
  1618.      rtx f, start;
  1619. {
  1620.   register int level = 1;
  1621.   register rtx insn, end;
  1622.  
  1623.   /* First find the LOOP_END that matches.
  1624.      Also check each insn for storing in memory and record where.  */
  1625.  
  1626.   unknown_address_altered = 0;
  1627.   unknown_aggregate_altered = 0;
  1628.   fixed_aggregate_altered = 0;
  1629.   loop_has_call = 0;
  1630.   loop_store_addrs_idx = 0;
  1631.  
  1632.   num_mem_sets = 0;
  1633.   loops_enclosed = 1;
  1634.   loop_continue = 0;
  1635.  
  1636.   for (insn = NEXT_INSN (start); level > 0; insn = NEXT_INSN (insn))
  1637.     {
  1638.       if (insn == 0)
  1639.     /* Parse errors can cause a loop-beg with no loop-end.  */
  1640.     return 0;
  1641.       if (GET_CODE (insn) == NOTE)
  1642.     {
  1643.       if (NOTE_LINE_NUMBER (insn) == NOTE_INSN_LOOP_BEG)
  1644.         {
  1645.           ++level;
  1646.           /* Count number of loops contained in this one.  */
  1647.           loops_enclosed++;
  1648.         }
  1649.       else if (NOTE_LINE_NUMBER (insn) == NOTE_INSN_LOOP_END)
  1650.         {
  1651.           --level;
  1652.           if (level == 0)
  1653.         {
  1654.           end = insn;
  1655.           break;
  1656.         }
  1657.         }
  1658.       else if (NOTE_LINE_NUMBER (insn) == NOTE_INSN_LOOP_CONT)
  1659.         {
  1660.           if (level == 1)
  1661.         loop_continue = insn;
  1662.         }
  1663.  
  1664.       /* Don't optimize loops containing setjmps.
  1665.          On some machines, longjmp does not restore the reg
  1666.          values as of the time of the setjmp.  */
  1667.       else if (NOTE_LINE_NUMBER (insn) == NOTE_INSN_SETJMP)
  1668.         return 0;
  1669.     }
  1670.       else if (GET_CODE (insn) == CALL_INSN)
  1671.     {
  1672.       unknown_address_altered = 1;
  1673.       loop_has_call = 1;
  1674.     }
  1675. /* ???
  1676.       else if (! unknown_address_altered) */
  1677.       else
  1678.     {
  1679.       if (GET_CODE (insn) == INSN || GET_CODE (insn) == JUMP_INSN)
  1680.         note_stores (PATTERN (insn), note_addr_stored);
  1681.     }
  1682.     }
  1683.  
  1684.   /* Now scan all jumps in the function and see if any of them can
  1685.      reach a label within the range of the loop.  */
  1686.  
  1687.   for (insn = f; insn; insn = NEXT_INSN (insn))
  1688.     if (GET_CODE (insn) == JUMP_INSN
  1689.     /* Don't get fooled by jumps inserted by loop-optimize.
  1690.        They don't have valid LUIDs, and they never jump into loops.  */
  1691.     && INSN_UID (insn) < max_uid
  1692.     && (INSN_LUID (insn) < INSN_LUID (start)
  1693.         || INSN_LUID (insn) > INSN_LUID (end))
  1694.     /* We have a jump that is outside the loop.
  1695.        Does it jump into the loop?  */
  1696.     && can_jump_into_range_p (PATTERN (insn),
  1697.                   INSN_LUID (start), INSN_LUID (end)))
  1698.       return 0;
  1699.  
  1700. #if 0      
  1701.   /* Now scan all labels between them and check for any jumps from outside.
  1702.      This uses the ref-chains set up by find_basic_blocks.
  1703.      This code is not used because it's more convenient for other reasons
  1704.      to do the loop optimization before find_basic_blocks.  */
  1705.  
  1706.   for (insn = start; insn != end; insn = NEXT_INSN (insn))
  1707.     if (GET_CODE (insn) == CODE_LABEL)
  1708.       {
  1709.     register rtx y;
  1710.     for (y = LABEL_REFS (insn); y != insn; y = LABEL_NEXTREF (y))
  1711.       if (INSN_LUID (CONTAINING_INSN (y)) < INSN_LUID (start)
  1712.           || INSN_LUID (CONTAINING_INSN (y)) > INSN_LUID (end))
  1713.         return 0;
  1714.       }
  1715. #endif
  1716.  
  1717.   return end;
  1718. }
  1719.  
  1720. /* Return 1 if somewhere in X is a LABEL_REF to a label
  1721.    located between BEG and END.  */
  1722.  
  1723. static int
  1724. can_jump_into_range_p (x, beg, end)
  1725.      rtx x;
  1726.      int beg, end;
  1727. {
  1728.   register enum rtx_code code = GET_CODE (x);
  1729.   register int i;
  1730.   register char *fmt;
  1731.  
  1732.   if (code == LABEL_REF)
  1733.     {
  1734.       register int luid = INSN_LUID (XEXP (x, 0));
  1735.       return luid > beg && luid < end;
  1736.     }
  1737.  
  1738.   fmt = GET_RTX_FORMAT (code);
  1739.   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
  1740.     {
  1741.       if (fmt[i] == 'e')
  1742.     {
  1743.       if (can_jump_into_range_p (XEXP (x, i), beg, end))
  1744.         return 1;
  1745.     }
  1746.       else if (fmt[i] == 'E')
  1747.     {
  1748.       register int j;
  1749.       for (j = 0; j < XVECLEN (x, i); j++)
  1750.         if (can_jump_into_range_p (XVECEXP (x, i, j), beg, end))
  1751.           return 1;
  1752.     }
  1753.     }
  1754.  
  1755.   return 0;
  1756. }
  1757.  
  1758. /* Return nonzero if there is a label in the range from
  1759.    insn INSN to the insn whose luid is END.  */
  1760.  
  1761. static int
  1762. labels_in_range_p (insn, end)
  1763.      rtx insn;
  1764.      int end;
  1765. {
  1766.   while (insn && INSN_LUID (insn) <= end)
  1767.     {
  1768.       if (GET_CODE (insn) == CODE_LABEL)
  1769.     return 0;
  1770.       insn = NEXT_INSN (insn);
  1771.     }
  1772.  
  1773.   return 0;
  1774. }
  1775.  
  1776. /* Record that a memory reference X is being set.  */
  1777.  
  1778. static void
  1779. note_addr_stored (x)
  1780.      rtx x;
  1781. {
  1782.   if (x == 0 || GET_CODE (x) != MEM)
  1783.     return;
  1784.  
  1785.   /* Count number of memory writes.
  1786.      This affects heuristics in strength_reduce.  */
  1787.   num_mem_sets++;
  1788.   if (unknown_address_altered)
  1789.     return;
  1790.  
  1791.   if (GET_MODE (x) == BLKmode)
  1792.     unknown_address_altered = 1;
  1793.   else if (rtx_addr_varies_p (x))
  1794.     {
  1795.       if (GET_CODE (XEXP (x, 0)) == PLUS)
  1796.     unknown_aggregate_altered = 1;
  1797.       else
  1798.     unknown_address_altered = 1;
  1799.     }
  1800.   else
  1801.     {
  1802.       register int i;
  1803.       register rtx addr = XEXP (x, 0);
  1804.  
  1805.       if (MEM_IN_STRUCT_P (x))
  1806.     fixed_aggregate_altered = 1;
  1807.       for (i = 0; i < loop_store_addrs_idx; i++)
  1808.     if (rtx_equal_p (loop_store_addrs[i], addr))
  1809.       {
  1810.         if (loop_store_widths[i] < GET_MODE_SIZE (GET_MODE (x)))
  1811.           loop_store_widths[i] = GET_MODE_SIZE (GET_MODE (x));
  1812.         break;
  1813.       }
  1814.       if (i == NUM_STORES)
  1815.     unknown_address_altered = 1;
  1816.       else if (i == loop_store_addrs_idx)
  1817.     {
  1818.       loop_store_widths[i] = GET_MODE_SIZE (GET_MODE (x));
  1819.       loop_store_addrs[loop_store_addrs_idx++] = addr;
  1820.     }
  1821.     }
  1822. }
  1823.  
  1824. /* Return nonzero if the rtx X is invariant over the current loop.
  1825.  
  1826.    The value is 2 if we refer to something only conditionally invariant.
  1827.  
  1828.    If `unknown_address_altered' is nonzero, no memory ref is invariant.
  1829.    Otherwise if `unknown_aggregate_altered' is nonzero,
  1830.    a memory ref is invariant if it is not part of an aggregate
  1831.    and its address is fixed and not in `loop_store_addrs'.
  1832.    Otherwise if `fixed_aggregate_altered' is nonzero,
  1833.    a memory ref is invariant
  1834.    if its address is fixed and not in `loop_store_addrs'.
  1835.    Otherwise, a memory ref is invariant if its address is fixed and not in
  1836.    `loop_store_addrs' or if it is not an aggregate.  */
  1837.  
  1838. static int
  1839. invariant_p (x)
  1840.      register rtx x;
  1841. {
  1842.   register int i;
  1843.   register enum rtx_code code;
  1844.   register char *fmt;
  1845.   int conditional = 0;
  1846.  
  1847.   if (x == 0)
  1848.     return 1;
  1849.   code = GET_CODE (x);
  1850.   switch (code)
  1851.     {
  1852.     case CONST_INT:
  1853.     case CONST_DOUBLE:
  1854.     case SYMBOL_REF:
  1855.     case LABEL_REF:
  1856.     case CONST:
  1857.       return 1;
  1858.  
  1859.     case PC:
  1860.     case CC0:
  1861.       return 0;
  1862.  
  1863.     case REG:
  1864.       /* We used to check RTX_UNCHANGING_P (x) here, but that is invalid
  1865.      since the reg might be set by initialization within the loop.  */
  1866.       if (x == frame_pointer_rtx || x == arg_pointer_rtx)
  1867.     return 1;
  1868.       if (n_times_set[REGNO (x)] == -1)
  1869.     return 2;
  1870.       return n_times_set[REGNO (x)] == 0;
  1871.  
  1872.     case MEM:
  1873.       /* Constants in the constant pool are invariant.
  1874.      ?? Really we should detect any constant address in the
  1875.      text section.  */
  1876.       if (GET_CODE (XEXP (x, 0)) == SYMBOL_REF
  1877.       && CONSTANT_POOL_ADDRESS_P (XEXP (x, 0)))
  1878.     return 1;
  1879.       /* A store in a varying-address scalar (or a subroutine call)
  1880.      could clobber anything in memory.  */
  1881.       if (unknown_address_altered)
  1882.     return 0;
  1883.       /* Don't mess with volatile memory references.  */
  1884.       if (MEM_VOLATILE_P (x))
  1885.     return 0;
  1886. #if 0
  1887.       /* If it's declared read-only, it is invariant
  1888.      if its address is invariant.  */
  1889.       if (RTX_UNCHANGING_P (x))
  1890.     return invariant_p (XEXP (x, 0));
  1891. #endif
  1892.       /* A store in a varying-address aggregate component
  1893.      could clobber anything except a scalar with a fixed address.  */
  1894.       if (unknown_aggregate_altered
  1895.       && ((MEM_IN_STRUCT_P (x) || GET_CODE (XEXP (x, 0)) == PLUS)
  1896.           || rtx_addr_varies_p (x)))
  1897.     return 0;
  1898.       /* A store in a fixed-address aggregate component
  1899.      could clobber anything whose address is not fixed,
  1900.      even an aggregate component.  */
  1901.       if (fixed_aggregate_altered
  1902.       && rtx_addr_varies_p (x))
  1903.     return 0;
  1904.       /* Any store could clobber a varying-address scalar.  */
  1905.       if (loop_store_addrs_idx
  1906.       && !(MEM_IN_STRUCT_P (x) || GET_CODE (XEXP (x, 0)) == PLUS)
  1907.       && rtx_addr_varies_p (x))
  1908.     return 0;
  1909.       /* A store in a fixed address clobbers overlapping references.  */
  1910.       for (i = loop_store_addrs_idx - 1; i >= 0; i--)
  1911.     if (addr_overlap_p (x, loop_store_addrs[i], loop_store_widths[i]))
  1912.       return 0;
  1913.       /* It's not invalidated by a store in memory
  1914.      but we must still verify the address is invariant.  */
  1915.       break;
  1916.  
  1917.     case ASM_OPERANDS:
  1918.       /* Don't mess with insns declared volatile.  */
  1919.       if (MEM_VOLATILE_P (x))
  1920.     return 0;
  1921.     }
  1922.  
  1923.   fmt = GET_RTX_FORMAT (code);
  1924.   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
  1925.     {
  1926.       if (fmt[i] == 'e')
  1927.     {
  1928.       int tem = invariant_p (XEXP (x, i));
  1929.       if (tem == 0)
  1930.         return 0;
  1931.       if (tem == 2)
  1932.         conditional = 1;
  1933.     }
  1934.       else if (fmt[i] == 'E')
  1935.     {
  1936.       register int j;
  1937.       for (j = 0; j < XVECLEN (x, i); j++)
  1938.         {
  1939.           int tem = invariant_p (XVECEXP (x, i, j));
  1940.           if (tem == 0)
  1941.         return 0;
  1942.           if (tem == 2)
  1943.         conditional = 1;
  1944.         }
  1945.  
  1946.     }
  1947.     }
  1948.  
  1949.   return 1 + conditional;
  1950. }
  1951.  
  1952. /* Return 1 if OTHER (a mem ref) overlaps the area of memory
  1953.    which is SIZE bytes starting at BASE.  */
  1954.  
  1955. int
  1956. addr_overlap_p (other, base, size)
  1957.      rtx other;
  1958.      rtx base;
  1959.      int size;
  1960. {
  1961.   int start = 0, end;
  1962.  
  1963.   if (GET_CODE (base) == CONST)
  1964.     base = XEXP (base, 0);
  1965.   if (GET_CODE (base) == PLUS
  1966.       && GET_CODE (XEXP (base, 1)) == CONST_INT)
  1967.     {
  1968.       start = INTVAL (XEXP (base, 1));
  1969.       base = XEXP (base, 0);
  1970.     }
  1971.  
  1972.   end = start + size;
  1973.   return refers_to_mem_p (other, base, start, end);
  1974. }
  1975.  
  1976. /* Return nonzero if all the insns in the loop that set REG
  1977.    are INSN and the immediately following insns,
  1978.    and if each of those insns sets REG in an invariant way
  1979.    (not counting uses of REG in them).
  1980.  
  1981.    The value is 2 if some of these insns are only conditionally invariant.
  1982.  
  1983.    We assume that INSN itself is the first set of REG
  1984.    and that its source is invariant.  */
  1985.  
  1986. static int
  1987. consec_sets_invariant_p (reg, n_sets, insn)
  1988.      int n_sets;
  1989.      rtx reg, insn;
  1990. {
  1991.   register rtx p = insn;
  1992.   register int regno = REGNO (reg);
  1993.   rtx temp;
  1994.   /* Number of sets we have to insist on finding after INSN.  */
  1995.   int count = n_sets - 1;
  1996.   int old = n_times_set[regno];
  1997.   int value = 0;
  1998.   int this;
  1999.  
  2000.   /* If N_SETS hit the limit, we can't rely on its value.  */
  2001.   if (n_sets == 127)
  2002.     return 0;
  2003.  
  2004.   n_times_set[regno] = 0;
  2005.  
  2006.   while (count > 0)
  2007.     {
  2008.       register enum rtx_code code;
  2009.       p = NEXT_INSN (p);
  2010.       code = GET_CODE (p);
  2011.  
  2012.       /* If library call, skip to end of of it.  */
  2013.       if (code == INSN && (temp = find_reg_note (p, REG_LIBCALL, 0)))
  2014.     p = XEXP (temp, 0);
  2015.  
  2016.       this = 0;
  2017.       if (code == INSN && GET_CODE (PATTERN (p)) == SET
  2018.       && GET_CODE (SET_DEST (PATTERN (p))) == REG
  2019.       && REGNO (SET_DEST (PATTERN (p))) == regno)
  2020.     {
  2021.       this = invariant_p (SET_SRC (PATTERN (p)));
  2022.       if (this != 0)
  2023.         value |= this;
  2024.       else if (temp = find_reg_note (p, REG_EQUAL, 0))
  2025.         {
  2026.           this = invariant_p (XEXP (temp, 0));
  2027.           if (this != 0)
  2028.         value |= this;
  2029.         }
  2030.     }
  2031.       if (this != 0)
  2032.     count--;
  2033.       else if (code != NOTE)
  2034.     {
  2035.       n_times_set[regno] = old;
  2036.       return 0;
  2037.     }
  2038.     }
  2039.  
  2040.   n_times_set[regno] = old;
  2041.   /* If invariant_p ever returned 2, we return 2.  */
  2042.   return 1 + (value & 2);
  2043. }
  2044.  
  2045. #if 0
  2046. /* I don't think this condition is sufficient to allow INSN
  2047.    to be moved, so we no longer test it.  */
  2048.  
  2049. /* Return 1 if all insns in the basic block of INSN and following INSN
  2050.    that set REG are invariant according to TABLE.  */
  2051.  
  2052. static int
  2053. all_sets_invariant_p (reg, insn, table)
  2054.      rtx reg, insn;
  2055.      short *table;
  2056. {
  2057.   register rtx p = insn;
  2058.   register int regno = REGNO (reg);
  2059.  
  2060.   while (1)
  2061.     {
  2062.       register enum rtx_code code;
  2063.       p = NEXT_INSN (p);
  2064.       code = GET_CODE (p);
  2065.       if (code == CODE_LABEL || code == JUMP_INSN)
  2066.     return 1;
  2067.       if (code == INSN && GET_CODE (PATTERN (p)) == SET
  2068.       && GET_CODE (SET_DEST (PATTERN (p))) == REG
  2069.       && REGNO (SET_DEST (PATTERN (p))) == regno)
  2070.     {
  2071.       if (!invariant_p (SET_SRC (PATTERN (p)), table))
  2072.         return 0;
  2073.     }
  2074.     }
  2075. }
  2076. #endif /* 0 */
  2077.  
  2078. /* Increment N_TIMES_SET at the index of each register
  2079.    that is modified by an insn between FROM and TO.
  2080.    If the value of an element of N_TIMES_SET becomes 127 or more,
  2081.    stop incrementing it, to avoid overflow.
  2082.  
  2083.    Store in *COUNT_PTR the number of actual instruction
  2084.    in the loop.  We use this to decide what is worth moving out.  */
  2085.  
  2086. /* last_set[n] is nonzero iff reg n has been set in the current basic block.
  2087.    In that case, it is the insn that last set reg n.  */
  2088.  
  2089. static void
  2090. count_loop_regs_set (from, to, may_not_move, count_ptr, nregs)
  2091.      register rtx from, to;
  2092.      char *may_not_move;
  2093.      int *count_ptr;
  2094.      int nregs;
  2095. {
  2096.   register rtx *last_set = (rtx *) alloca (nregs * sizeof (rtx));
  2097.   register rtx insn;
  2098.   register int count = 0;
  2099.   register rtx dest;
  2100.  
  2101.   bzero (last_set, nregs * sizeof (rtx));
  2102.   for (insn = from; insn != to; insn = NEXT_INSN (insn))
  2103.     {
  2104.       if (GET_CODE (insn) == CALL_INSN)
  2105.     {
  2106.       /* If a register is used as a subroutine address,
  2107.          don't allow this register's setting to be moved out of the loop.
  2108.          This condition is not at all logically correct
  2109.          but it averts a very common lossage pattern
  2110.          and creates lossage much less often.  */
  2111.       if (GET_CODE (PATTERN (insn)) == CALL
  2112.           && GET_CODE (XEXP (PATTERN (insn), 0)) == MEM
  2113.           && GET_CODE (XEXP (XEXP (PATTERN (insn), 0), 0)) == REG)
  2114.         {
  2115.           register int regno
  2116.         = REGNO (XEXP (XEXP (PATTERN (insn), 0), 0));
  2117.           may_not_move[regno] = 1;
  2118.         }
  2119.       else if (GET_CODE (PATTERN (insn)) == SET
  2120.           && GET_CODE (SET_SRC (PATTERN (insn))) == CALL
  2121.           && GET_CODE (XEXP (SET_SRC (PATTERN (insn)), 0)) == MEM
  2122.           && GET_CODE (XEXP (XEXP (SET_SRC (PATTERN (insn)), 0), 0)) == REG)
  2123.         {
  2124.           register int regno
  2125.         = REGNO (XEXP (XEXP (SET_SRC (PATTERN (insn)), 0), 0));
  2126.           may_not_move[regno] = 1;
  2127.           /* The call insn itself sets a reg, which cannot be moved.  */
  2128.           may_not_move[REGNO (SET_DEST (PATTERN (insn)))] = 1;
  2129.           if (n_times_set[REGNO (SET_DEST (PATTERN (insn)))] < 127)
  2130.         n_times_set[REGNO (SET_DEST (PATTERN (insn)))]++;
  2131.         }
  2132.     }
  2133.       if (GET_CODE (insn) == INSN || GET_CODE (insn) == JUMP_INSN) 
  2134.     {
  2135.       ++count;
  2136.       if (GET_CODE (PATTERN (insn)) == CLOBBER
  2137.           && GET_CODE (XEXP (PATTERN (insn), 0)) == REG)
  2138.         /* Don't move a reg that has an explicit clobber.
  2139.            We might do so sometimes, but it's not worth the pain.  */
  2140.         may_not_move[REGNO (XEXP (PATTERN (insn), 0))] = 1;
  2141.       else if (GET_CODE (PATTERN (insn)) == SET)
  2142.         {
  2143.           dest = SET_DEST (PATTERN (insn));
  2144.           while (GET_CODE (dest) == SUBREG
  2145.              || GET_CODE (dest) == ZERO_EXTRACT
  2146.              || GET_CODE (dest) == SIGN_EXTRACT
  2147.              || GET_CODE (dest) == STRICT_LOW_PART)
  2148.         dest = XEXP (dest, 0);
  2149.           if (GET_CODE (dest) == REG)
  2150.         {
  2151.           register int regno = REGNO (dest);
  2152.           /* If this is the first setting of this reg
  2153.              in current basic block, and it was set before,
  2154.              it must be set in two basic blocks, so it cannot
  2155.              be moved out of the loop.  */
  2156.           if (n_times_set[regno] > 0 && last_set[regno] == 0)
  2157.             may_not_move[regno] = 1;
  2158.           /* If this is not first setting in current basic block,
  2159.              see if reg was used in between previous one and this.
  2160.              If so, neither one can be moved.  */
  2161.           if (last_set[regno] != 0
  2162.               && reg_used_between_p (dest, last_set[regno], insn))
  2163.             may_not_move[regno] = 1;
  2164.           if (n_times_set[regno] < 127)
  2165.             ++n_times_set[regno];
  2166.           last_set[regno] = insn;
  2167.         }
  2168.         }
  2169.       else if (GET_CODE (PATTERN (insn)) == PARALLEL)
  2170.         {
  2171.           register int i;
  2172.           for (i = XVECLEN (PATTERN (insn), 0) - 1; i >= 0; i--)
  2173.         {
  2174.           register rtx x = XVECEXP (PATTERN (insn), 0, i);
  2175.           if (GET_CODE (x) == CLOBBER && GET_CODE (XEXP (x, 0)) == REG)
  2176.             /* Don't move a reg that has an explicit clobber.
  2177.                It's not worth the pain to try to do it correctly.  */
  2178.             may_not_move[REGNO (XEXP (x, 0))] = 1;
  2179.           if (GET_CODE (x) == SET)
  2180.             {
  2181.               dest = SET_DEST (x);
  2182.               while (GET_CODE (dest) == SUBREG
  2183.                  || GET_CODE (dest) == ZERO_EXTRACT
  2184.                  || GET_CODE (dest) == SIGN_EXTRACT
  2185.                  || GET_CODE (dest) == STRICT_LOW_PART)
  2186.             dest = XEXP (dest, 0);
  2187.               if (GET_CODE (dest) == REG)
  2188.             {
  2189.               register int regno = REGNO (dest);
  2190.               if (n_times_set[regno] < 127)
  2191.                 ++n_times_set[regno];
  2192.               may_not_move[regno] = 1;
  2193.               last_set[regno] = insn;
  2194.             }
  2195.             }
  2196.         }
  2197.         }
  2198.     }
  2199.       if (GET_CODE (insn) == CODE_LABEL || GET_CODE (insn) == JUMP_INSN)
  2200.     bzero (last_set, nregs * sizeof (rtx));
  2201.     }
  2202.   *count_ptr = count;
  2203. }
  2204.  
  2205. /* Given a loop that is bounded by LOOP_START and LOOP_END
  2206.    and that is entered at SCAN_START,
  2207.    return 1 if the register set by insn INSN is used by
  2208.    any insn that precedes INSN in cyclic order starting
  2209.    from the loop entry point.  */
  2210.  
  2211. static int
  2212. loop_reg_used_before_p (insn, loop_start, scan_start, loop_end)
  2213.      rtx insn, loop_start, scan_start, loop_end;
  2214. {
  2215.   rtx reg = SET_DEST (PATTERN (insn));
  2216.   if (INSN_LUID (scan_start) > INSN_LUID (insn))
  2217.     return (reg_used_between_p (reg, scan_start, loop_end)
  2218.         || reg_used_between_p (reg, loop_start, insn));
  2219.   else
  2220.     return reg_used_between_p (reg, scan_start, insn);
  2221. }
  2222.  
  2223. /* A "basic induction variable" or biv is a pseudo reg that is set
  2224.    (within this loop) only by incrementing or decrementing it.  */
  2225. /* A "general induction variable" or giv is a pseudo reg whose
  2226.    value is a linear function of a biv.  */
  2227.  
  2228. /* Bivs are recognized by `basic_induction_var';
  2229.    Givs by `general_induct_var'.  */
  2230.  
  2231. /* An enum for the two different types of givs, those that are used
  2232.    as memory addresses and those that are calculated into registers.  */
  2233. enum g_types { DEST_ADDR, DEST_REG };
  2234.  
  2235. /* A `struct induction' is created for every instruction that sets
  2236.    an induction variable (either a biv or a giv).  */
  2237.  
  2238. struct induction
  2239. {
  2240.   rtx insn;               /* The insn that sets a biv or giv */
  2241.   rtx new_reg;               /* New register, containing strength reduced
  2242.                   version of this giv.  */
  2243.   int src_regno;           /* Biv from which this giv is computed.
  2244.                   (If this is a biv, then this is the biv.)  */
  2245.   enum g_types giv_type;       /* Indicate whether DEST_ADDR or DEST_REG giv */
  2246.   int dest_regno;           /* Destination register for insn: this is the
  2247.                   register which was the biv or giv.
  2248.                   For a biv, this equals src_reg.
  2249.                   For a DEST_ADDR type giv, this is 0.  */
  2250.   rtx *location;           /* Place in the insn where this giv occurs.
  2251.                   If GIV_TYPE is DEST_REG, this is 0.  */
  2252.   enum machine_mode mode;      /* The mode of this biv or giv */
  2253.   rtx mult_val;               /* Multiplicative factor for src_reg.  */
  2254.   rtx add_val;               /* Additive constant for that product.  */
  2255.   int benefit;               /* Gain from eliminating this insn.  */
  2256.   int consec;               /* The number of consecutive insn that set this
  2257.                   register; they are all eliminated if this
  2258.                   one is.  */
  2259.   char replaceable;           /* 1 if we can substitute the strength-reduced
  2260.                   variable for the original variable.
  2261.                   0 means they must be kept separate and the
  2262.                   new one must be copied into the old pseudo
  2263.                   reg each time the old one is set.  */
  2264.   char ignore;               /* 1 prohibits further processing of this giv */
  2265.   int lifetime;               /* Length of life of this giv */
  2266.   int times_used;           /* # times this giv is used. */
  2267.   struct induction *family;    /* Links together all induction variables that
  2268.                   have the same src register.  */
  2269.   struct induction *forces;    /* Points to an induction variable insn which
  2270.                   is used only once, to compute this giv,
  2271.                   and hence can be deleted if this insn is
  2272.                   strength reduced.  */
  2273.   struct induction *forces2;   /* Likewise.  */
  2274.   struct induction *same;      /* Links together all induction variables that
  2275.                   have the same tuple (src, mult, add).  */
  2276. };
  2277.  
  2278. /* A `struct iv_class' is created for each biv.  */
  2279.  
  2280. struct iv_class {
  2281.   int regno;                   /* Pseudo reg which is the biv.  */
  2282.   int biv_count;               /* Number of insns setting this reg.  */
  2283.   struct induction *biv;       /* List of all insns that set this reg.  */
  2284.   int giv_count;               /* Number of DEST_REG givs computed from this
  2285.                   biv.  The resulting count is only used in
  2286.                    check_dbra_loop.  */
  2287.   struct induction *giv;       /* List of all insns that compute a giv
  2288.                   from this reg.  */
  2289.   int total_benefit;           /* Sum of BENEFITs of all those givs */
  2290.   rtx initial_value;           /* Value of reg at loop start */
  2291.   struct iv_class *next;       /* Links all class structures together */
  2292.   rtx init_insn;           /* insn which intializes biv, 0 if none seen. */
  2293.   char eliminable;           /* 1 if plausible candidate for elimination.  */
  2294.   char nonneg;               /* 1 if we added a REG_NONNEG note for this.  */
  2295. };
  2296.  
  2297. /* Definitions used by the basic induction variable discovery code.  */
  2298. enum iv_mode { UNKNOWN_INDUCT, BASIC_INDUCT, NOT_BASIC_INDUCT,
  2299.          GENERAL_INDUCT };
  2300.  
  2301. /* Relative gain of eliminating various kinds of operations.  */
  2302. #define NO_BENEFIT    0
  2303. #define ADD_BENEFIT   1
  2304. #define SHIFT_BENEFIT 2
  2305. #define MULT_BENEFIT  4
  2306. #define LIBCALL_BENEFIT 15
  2307. /* Benefit penalty, if a giv is not replaceable, i.e. must emit an insn to
  2308.    copy the value of the strength reduced giv to its original register.  */
  2309. #define COPY_PENALTY  2
  2310.  
  2311. /* Indexed by register number, indicates whether or not register is an
  2312.    induction variable, and if so what type.  */
  2313.  
  2314. static enum iv_mode *induct_var;
  2315.  
  2316. /* Indexed by register number, contains pointer to `struct induction'
  2317.    if register is a general induction variable.  */
  2318.  
  2319. static struct induction **induct_struct;
  2320.  
  2321. /* Indexed by register number, contains pointer to `struct iv_class'
  2322.    if register is a basic induction variable.  */
  2323.  
  2324. static struct iv_class **class_struct;
  2325.  
  2326. /*********************************/
  2327.  
  2328. /* ??? Unfinished optimizations, wilson@ji.Berkeley.EDU */
  2329.  
  2330. /* strength reduce addresses found in sources (set () (mem ())*/
  2331.  
  2332. /* There is one more optimization you might be interested in doing: to
  2333.    allocate pseudo registers for frequently-accessed memory locations.
  2334.    If the same memory location is referenced each time around, it might
  2335.    be possible to copy it into a register before and out after.
  2336.    This is especially useful when the memory location is a variable which
  2337.    is in a stack slot because somewhere its address is taken.  If the
  2338.    loop doesn't contain a function call and the variable isn't volatile,
  2339.    it is safe to keep the value in a register for the duration of the
  2340.    loop. One tricky thing is that the copying of the value back from the
  2341.    register has to be done on all exits from the loop.  You need to check that
  2342.    all the exits from the loop go to the same place. */
  2343.  
  2344. /* WARNING: the interaction of biv elimination, and recognizing 'constant'
  2345.    bivs may cause problems */
  2346.  
  2347. /* add heuristic so that DEST_ADDR strength reduction does not cause
  2348.    performance problems */
  2349.  
  2350. /* don't eliminate things that can be combined with an addressing mode?
  2351.    find all giv that have same biv and mult_val (now must also have
  2352.    same add_val), then for each giv, check to see if its only use
  2353.    dies in a following memory address, generate a new memory address
  2354.    and check to see if valid, if valid then store modified mem addr,
  2355.    else if not valid addr mark giv as not done so that it will get its
  2356.    own iv */
  2357.  
  2358. /* consec_sets_giv does not calculate replaceable and forces correctly,
  2359.    forces should be a more general linked list instead of two entries */
  2360.  
  2361. /* try to optimize branches when it is known that a biv is always positive */
  2362.  
  2363. /* when replace biv in compare insn, should replace with closest giv so that
  2364.    an optimized branch can still be recognized by combiner, i.e. VAXen acb */
  2365.  
  2366. /* should merge final_value calculation in check_dbra_loop with the 
  2367.    new final_biv_value function */
  2368.  
  2369. /* many of the checks involving uid_luid could be simplified if regscan
  2370.    was rerun in loop_optimize() whenever a register was added or moved,
  2371.    also some of the optimizations could be a little less conservative */
  2372.  
  2373. /* Perform strength reduction and induction variable elimination.  */
  2374.  
  2375. /* Pseudo registers created during this function will be beyond the last
  2376.    valid index in several tables including n_times_set and regno_last_uid.
  2377.    This does not cause a problem here, because the added registers cannot be
  2378.    givs outside of their loop, and hence will never be reconsidered.
  2379.    But scan_loop must check regnos to make sure they are in bounds.  */
  2380.  
  2381. static void
  2382. strength_reduce (scan_start, end, loop_top, insn_count,
  2383.          loop_start, loop_end, nregs)
  2384.      rtx scan_start;
  2385.      rtx end;
  2386.      rtx loop_top;
  2387.      int insn_count;
  2388.      rtx loop_start;
  2389.      rtx loop_end;
  2390.      int nregs;
  2391. {
  2392.   rtx p;
  2393.   rtx inc_val;
  2394.   rtx mult_val;
  2395.   int dest_regno;
  2396.   int biv_found;
  2397.   /* This is 1 if current insn could be executed zero times in the loop.  */
  2398.   int maybe_never = 0;
  2399.   /* List of all possible basic induction variables.  */
  2400.   struct iv_class *iv_list = 0;
  2401.   /* Temporary list pointers for traversing iv_list.  */
  2402.   struct iv_class *bl, *backbl;
  2403.   /* Ratio of extra register life span we can justify
  2404.      for saving an instruction.  More if loop doesn't call subroutines
  2405.      since in that case saving an insn makes more difference
  2406.      and more registers are available.  */
  2407.   /* ??? could set this to last value of threshold in move_movables */
  2408.   int threshold = loop_has_call ? 17 : 34;
  2409.   /* Map of pseudo-register replacements.  */
  2410.   rtx *reg_map;
  2411.   int call_seen;
  2412.  
  2413.   induct_var = (enum iv_mode *) alloca (nregs * sizeof (induct_var[0]));
  2414.   bzero ((char *)induct_var, nregs * sizeof (induct_var[0]));
  2415.   induct_struct = (struct induction **)
  2416.     alloca (nregs * sizeof (struct induction *));
  2417.   bzero ((char *)induct_struct, nregs * sizeof (struct induction *));
  2418.   class_struct = (struct iv_class **)
  2419.     alloca (nregs * sizeof (struct iv_class *));
  2420.   bzero ((char *)class_struct, nregs * sizeof (struct iv_class *));
  2421.  
  2422.   /* Scan through loop to find all possible bivs.  */
  2423.  
  2424.   for (p = NEXT_INSN (loop_start); p != end; p = NEXT_INSN (p))
  2425.     {
  2426.       if (GET_CODE (p) == INSN
  2427.       && GET_CODE (PATTERN (p)) == SET
  2428.       && GET_CODE (SET_DEST (PATTERN (p))) == REG)
  2429.     {
  2430.       dest_regno = REGNO (SET_DEST (PATTERN (p)));
  2431.       if (induct_var[dest_regno] != NOT_BASIC_INDUCT
  2432.           && dest_regno >= FIRST_PSEUDO_REGISTER)
  2433.         {
  2434.           if (basic_induction_var (SET_SRC (PATTERN (p)), dest_regno,
  2435.                       &inc_val, &mult_val))
  2436.         {
  2437.           /* It is a possible basic induction variable.
  2438.              Create and initialize an induction structure for it.  */
  2439.  
  2440.           struct induction *v =
  2441.             (struct induction *) alloca (sizeof (struct induction));
  2442.  
  2443.           v->insn = p;
  2444.           v->src_regno = dest_regno;
  2445.           v->dest_regno = dest_regno;
  2446.           v->mult_val = mult_val;
  2447.           v->add_val = inc_val;
  2448.           v->mode = GET_MODE (SET_DEST (PATTERN (p)));
  2449.  
  2450.           /* Add this to the reg's iv_class, creating a class
  2451.              if this is the first incrementation of the reg.  */
  2452.  
  2453.           bl = class_struct[dest_regno];
  2454.           if (bl)
  2455.             {
  2456.               v->family = bl->biv;
  2457.               bl->biv = v;
  2458.               bl->biv_count++;
  2459.             }
  2460.           else
  2461.             {
  2462.               /* Create and initialize new iv_class.  */
  2463.  
  2464.               bl = (struct iv_class *) alloca (sizeof (struct iv_class));
  2465.  
  2466.               bl->regno = dest_regno;
  2467.               bl->biv = v;
  2468.               v->family = 0;
  2469.               bl->giv = 0;
  2470.               bl->biv_count = 1;
  2471.               bl->giv_count = 0;
  2472.  
  2473.               /* Set initial value to the reg itself.  */
  2474.               bl->initial_value = SET_DEST (PATTERN (p));
  2475.               /* We haven't seen the intializing insn yet */
  2476.               bl->init_insn = 0;
  2477.               bl->eliminable = 0;
  2478.               bl->nonneg = 0;
  2479.  
  2480.               /* Add this insn to iv_list.  */
  2481.               bl->next = iv_list;
  2482.               iv_list = bl;
  2483.  
  2484.               /* Put it in the array of iv_lists.  */
  2485.               class_struct[dest_regno] = bl;
  2486.             }
  2487.  
  2488.           induct_var[dest_regno] = BASIC_INDUCT;
  2489.  
  2490.           if (loop_dump_stream)
  2491.             {
  2492.               fprintf (loop_dump_stream,
  2493.                    "Insn %d: possible biv, reg %d,",
  2494.                    INSN_UID (p), dest_regno);
  2495.               if (GET_CODE (inc_val) == CONST_INT)
  2496.             fprintf (loop_dump_stream, " const = %d\n",
  2497.                  INTVAL (inc_val));
  2498.               else
  2499.             {
  2500.               fprintf (loop_dump_stream, " const = ");
  2501.               print_rtl (loop_dump_stream, inc_val);
  2502.               fprintf (loop_dump_stream, "\n");
  2503.             }
  2504.             }
  2505.         }
  2506.           else
  2507.         induct_var[dest_regno] = NOT_BASIC_INDUCT;
  2508.         }
  2509.     }
  2510.     }
  2511.  
  2512.   /* Scan iv_list to remove all regs that proved not to be bivs.
  2513.      Make a sanity check against n_times_set.  */
  2514.  
  2515.   biv_found = 0;
  2516.  
  2517.   for (backbl = bl = iv_list; bl; backbl = bl, bl = bl->next)
  2518.     {
  2519.       if (induct_var[bl->regno] != BASIC_INDUCT)
  2520.     {
  2521.       /* Not a basic induction variable, remove this iv_class.  */
  2522.  
  2523.       if (backbl == bl)
  2524.         iv_list = bl->next;
  2525.       else
  2526.         backbl->next = bl->next;
  2527.  
  2528.       if (loop_dump_stream)
  2529.         fprintf (loop_dump_stream, "Reg %d: biv discarded, not induct\n",
  2530.             bl->regno);
  2531.     }
  2532.       else if (n_times_set[bl->regno] != bl->biv_count)
  2533.     {
  2534.       /* This happens if register modified by subreg, etc.  */
  2535.       /* Make sure it is not recognized as a basic induction var: */
  2536.       /* remove this iv_class from iv_list.  */
  2537.  
  2538.       induct_var[bl->regno] = NOT_BASIC_INDUCT;
  2539.  
  2540.       if (backbl == bl)
  2541.         iv_list = bl->next;
  2542.       else
  2543.         backbl->next = bl->next;
  2544.  
  2545.       if (loop_dump_stream)
  2546.         fprintf (loop_dump_stream, "Reg %d: biv discarded, count error\n",
  2547.             bl->regno);
  2548.     }
  2549.       else
  2550.     {
  2551.       /* This is a valid basic induction variable.  */
  2552.  
  2553.       biv_found++;
  2554.  
  2555.       if (loop_dump_stream)
  2556.         fprintf (loop_dump_stream, "Reg %d: biv verified\n", bl->regno);
  2557.     }
  2558.     }
  2559.  
  2560.   /* Exit if there are no bivs.  */
  2561.   if (!iv_list)
  2562.     return;
  2563.  
  2564.   /* Find initial value for each biv.  */
  2565.   /* Search backwards from loop_start, halting at first label
  2566.      or when all bivs have been seen.  */
  2567.  
  2568.   call_seen = 0;
  2569.   p = loop_start;
  2570.   while (biv_found)
  2571.     {
  2572.       p = PREV_INSN (p);
  2573.       if (p == 0)
  2574.     break;
  2575.  
  2576.       if (GET_CODE (p) == CALL_INSN)
  2577.     call_seen = 1;
  2578.  
  2579.       if (GET_CODE (p) == INSN
  2580.       && GET_CODE (PATTERN (p)) == SET)
  2581.     {
  2582.       rtx dest = SET_DEST (PATTERN (p));
  2583.  
  2584.       while (GET_CODE (dest) == SUBREG
  2585.          || GET_CODE (dest) == ZERO_EXTRACT
  2586.          || GET_CODE (dest) == SIGN_EXTRACT
  2587.          || GET_CODE (dest) == STRICT_LOW_PART)
  2588.         dest = XEXP (dest, 0);
  2589.  
  2590.       if (GET_CODE (dest) == REG)
  2591.         {
  2592.           int dest_regno = REGNO (dest);
  2593.           if (induct_var[dest_regno] == BASIC_INDUCT
  2594.           && class_struct[dest_regno]->init_insn == 0)
  2595.         {
  2596.           /* This is the first modification found for this reg.  */
  2597.  
  2598.           rtx src = SET_SRC (PATTERN (p));
  2599.  
  2600.           /* Record the intializing INSN */
  2601.  
  2602.           class_struct[dest_regno]->init_insn = p;
  2603.  
  2604.           if (loop_dump_stream)
  2605.             fprintf (loop_dump_stream, "Biv %d initialized at insn %d: ",
  2606.                  dest_regno, INSN_UID (p));
  2607.  
  2608.           /* Save value if it is a constant or register.  */
  2609.           if (CONSTANT_P (src)
  2610.               || (GET_CODE (src) == REG
  2611.               /* Don't try to use a value in a hard reg
  2612.                  across a call which clobbers it.  */
  2613.               && ! (REGNO (src) < FIRST_PSEUDO_REGISTER
  2614.                 && call_used_regs[REGNO (src)]
  2615.                 && call_seen)
  2616.               && ! reg_set_between_p (src, p, loop_start)))
  2617.             {
  2618.               class_struct[dest_regno]->initial_value = src;
  2619.  
  2620.               if (loop_dump_stream)
  2621.             fprintf (loop_dump_stream, "initial value ");
  2622.               if (loop_dump_stream)
  2623.             {
  2624.               if (GET_CODE (src) == CONST_INT)
  2625.                 fprintf (loop_dump_stream, "%d\n", INTVAL (src));
  2626.               else
  2627.                 {
  2628.                   print_rtl (loop_dump_stream, src);
  2629.                   fprintf (loop_dump_stream, "\n");
  2630.                 }
  2631.             }
  2632.             }
  2633.           else
  2634.             {
  2635.               /* Biv initial value is not simple move,
  2636.              so let it keep intial value of "itself".  */
  2637.  
  2638.               if (loop_dump_stream)
  2639.             fprintf (loop_dump_stream, "complex initial value\n");
  2640.             }
  2641.  
  2642.           biv_found--;
  2643.         }
  2644.         }
  2645.     }
  2646.       else if (GET_CODE (p) == CODE_LABEL)
  2647.     break;
  2648.     }
  2649.  
  2650.   /* Search the loop for general induction variables.  */
  2651.  
  2652.   /* A register is a giv if: it is only set once, it is a function of a
  2653.      biv and a constant (or invariant), and it is not a biv.  */
  2654.  
  2655.   p = scan_start;
  2656.   while (1)
  2657.     {
  2658.       p = NEXT_INSN (p);
  2659.       /* At end of a straight-in loop, we are done.
  2660.      At end of a loop entered at the bottom, scan the top.  */
  2661.       if (p == scan_start)
  2662.     break;
  2663.       if (p == end)
  2664.     {
  2665.       if (loop_top != 0)
  2666.         p = NEXT_INSN (loop_top);
  2667.       else
  2668.         break;
  2669.       if (p == scan_start)
  2670.         break;
  2671.     }
  2672.  
  2673.       /* Look for a general induction variable in a register.  */
  2674.       if (GET_CODE (p) == INSN
  2675.       && GET_CODE (PATTERN (p)) == SET
  2676.       && GET_CODE (SET_DEST (PATTERN (p))) == REG)
  2677.     {
  2678.       int src_regno;
  2679.       rtx add_val;
  2680.       rtx mult_val;
  2681.       int benefit;
  2682.       rtx regnote = 0;
  2683.       struct induction *forces = 0;
  2684.       struct induction *forces2 = 0;
  2685.  
  2686.       dest_regno = REGNO (SET_DEST (PATTERN (p)));
  2687.       if (dest_regno < FIRST_PSEUDO_REGISTER)
  2688.         continue;
  2689.  
  2690.       if (/* Normal giv.  */
  2691.           ((benefit = general_induction_var (SET_SRC (PATTERN (p)),
  2692.                          &src_regno, &add_val,
  2693.                          &mult_val,
  2694.                          &forces, &forces2))
  2695.            /* Giv set with call to a library routine.  */
  2696.            || ((regnote = find_reg_note (p, REG_EQUAL, 0))
  2697.            &&
  2698.            (benefit = general_induction_var (XEXP (regnote, 0),
  2699.                              &src_regno,
  2700.                              &add_val, &mult_val,
  2701.                              &forces, &forces2))))
  2702.           /* Don't try to handle any regs made by loop optimization.
  2703.          We have nothing on them in regno_first_uid, etc.  */
  2704.           && dest_regno < old_max_reg
  2705.           /* Don't recognize a BASIC_INDUCT_VAR here.  */
  2706.           && dest_regno != src_regno
  2707.           /* This must be the only place where the register is set.  */
  2708.           && (n_times_set[dest_regno] == 1
  2709.           || (benefit = consec_sets_giv (benefit, p,
  2710.                          src_regno, dest_regno,
  2711.                          &add_val, &mult_val))))
  2712.         {
  2713.           int count;
  2714.           struct induction *v =
  2715.         (struct induction *) alloca (sizeof (struct induction));
  2716.           rtx temp;
  2717.  
  2718.           record_giv (v, p, src_regno, dest_regno, mult_val, add_val, benefit,
  2719.               forces, forces2, DEST_REG, maybe_never, 0, loop_end);
  2720.  
  2721.           /* Skip the consecutive insns, if there are any.  */
  2722.           for (count = v->consec - 1; count >= 0; count--)
  2723.         {
  2724.           /* If first insn of libcall sequence, skip to end.  */
  2725.           /* Do this at start of loop, since INSN is guaranteed to
  2726.              be an insn here.  */
  2727.           if (temp = find_reg_note (p, REG_LIBCALL, 0))
  2728.             {
  2729.               /* Eliminating a libcall does more good than
  2730.              eliminating a single insn to do the same job.  */
  2731.               benefit += LIBCALL_BENEFIT;
  2732.               p = XEXP (temp, 0);
  2733.             }
  2734.  
  2735.           do p = NEXT_INSN (p);
  2736.           while (GET_CODE (p) == NOTE);
  2737.         }
  2738.         }
  2739.     }
  2740.  
  2741. #ifndef DONT_REDUCE_ADDR
  2742.       /* Look for givs which are memory addresses.  */
  2743.       /* This resulted in worse code on a VAX 8600.  I wonder if it
  2744.      still does.  */
  2745.       if (GET_CODE (p) == INSN)
  2746.     find_mem_givs (PATTERN (p), p, maybe_never, loop_end);
  2747. #endif
  2748.  
  2749.       /* Past a label or a jump, we get to insns for which we can't count
  2750.      on whether or how many times they will be executed during each
  2751.      iteration.  Givs found afterwards cannot be marked replaceable.  */
  2752.       if (GET_CODE (p) == CODE_LABEL || GET_CODE (p) == JUMP_INSN)
  2753.     maybe_never = 1;
  2754.     }
  2755.  
  2756.   /* Try to prove that the loop counter variable (if any) is always
  2757.      nonnegative; if so, record that fact with a REG_NONNEG note
  2758.      so that "decrement and branch until zero" insn can be used.  */
  2759.   check_dbra_loop (loop_end, iv_list, insn_count, loop_start);
  2760.  
  2761.   /* Create reg_map to hold substitutions for replaceable giv regs.  */
  2762.   reg_map = (rtx *) alloca (nregs * sizeof (rtx));
  2763.   bzero ((char *)reg_map, nregs * sizeof (rtx));
  2764.  
  2765.   /* Examine each iv class for feasibility of strength reduction/induction
  2766.      variable elimination.  */
  2767.  
  2768.   for (bl = iv_list; bl; bl = bl->next)
  2769.     {
  2770.       struct induction *v;
  2771.       int benefit;
  2772.       int replaceable;
  2773.       int all_reduced;
  2774.       rtx final_value = 0;
  2775.  
  2776.       /* Test whether it will be possible to eliminate this biv
  2777.      provided all givs are reduced.  This is possible if either
  2778.      the reg is not used outside the loop, or we can compute
  2779.      what its final value will be.
  2780.  
  2781.      Don't try if we put a REG_NONNEG note on the endtest for this biv.
  2782.      ??? That should be only on machines that have dbra insns.  */
  2783.  
  2784.       /* Compare against bl->init_insn rather than loop_start.
  2785.      We aren't concerned with any uses of the biv between
  2786.      init_insn and loop_start since these won't be affected
  2787.      by the value of the biv elsewhere in the function, so
  2788.      long as init_insn doesn't use the biv itself.
  2789.      March 14, 1989 -- self@bayes.arc.nasa.gov */
  2790.  
  2791.       if ((uid_luid[regno_last_uid[bl->regno]] < INSN_LUID (loop_end)
  2792.        && bl->init_insn
  2793.        && INSN_UID (bl->init_insn) < max_uid
  2794.        && uid_luid[regno_first_uid[bl->regno]] >= INSN_LUID (bl->init_insn)
  2795.        && ! reg_mentioned_p (SET_DEST (PATTERN (bl->biv->insn)),
  2796.                  SET_SRC (PATTERN (bl->init_insn)))
  2797.        && ! bl->nonneg)
  2798.       || (final_value = final_biv_value (bl, loop_end)))
  2799.     check_eliminate_biv (bl, loop_start, end);
  2800.       else
  2801.     {
  2802.       if (loop_dump_stream)
  2803.         {
  2804.           fprintf (loop_dump_stream,
  2805.                "Cannot eliminate biv %d.\n",
  2806.                bl->regno);
  2807.           fprintf (loop_dump_stream,
  2808.                "First use: insn %d, last use: insn %d.\n",
  2809.                regno_first_uid[bl->regno],
  2810.                regno_last_uid[bl->regno]);
  2811.         }
  2812.     }
  2813.  
  2814.       /* This will be true at the end, if all givs which depend on this
  2815.      biv have been strength reduced.
  2816.      We can't (currently) eliminate the biv unless this is so.  */
  2817.       all_reduced = 1;
  2818.  
  2819.       /* Check each giv in this class.  */
  2820.  
  2821.       for (v = bl->giv; v; v = v->family)
  2822.     {
  2823.       struct induction *tv;
  2824.  
  2825.       if (v->ignore)
  2826.         continue;
  2827.  
  2828.       benefit = v->benefit;
  2829.       replaceable = v->replaceable;
  2830.  
  2831.       /* Reduce benefit if not replaceable, since we will insert
  2832.          a move-insn to replace the insn that calculates this giv.  */
  2833.       if (!replaceable && ! bl->eliminable)
  2834.         benefit -= COPY_PENALTY;
  2835.  
  2836.       /* Decrease the benefit to count the add-insns that we will
  2837.          insert to increment the reduced reg for the giv.  */
  2838.       benefit -= ADD_BENEFIT * bl->biv_count;
  2839.  
  2840.       /* Find all equivalent givs (that bear same relation to the biv).
  2841.          Link them via the `same' field and add their benefits together.
  2842.          They can be replaced with a single register.  */
  2843.  
  2844.       for (tv = v->family; tv; tv = tv->family)
  2845.         {
  2846.           if (tv->ignore == 0
  2847.           && tv->src_regno == v->src_regno
  2848.           && rtx_equal_p (tv->mult_val, v->mult_val)
  2849.           && rtx_equal_p (tv->add_val, v->add_val))
  2850.         {
  2851.           benefit += tv->benefit;
  2852.           if (! tv->replaceable)
  2853.             benefit -= COPY_PENALTY;
  2854.           v->lifetime += tv->lifetime;
  2855.           v->times_used += tv->times_used;
  2856.           tv->ignore = 1;
  2857.  
  2858.           /* Link them together via `same' field.  */
  2859.           tv->same = v->same;
  2860.           v->same = tv;
  2861.  
  2862.           if (loop_dump_stream)
  2863.             fprintf (loop_dump_stream,
  2864.                  "giv of insn %d combined with that of %d.\n",
  2865.                  INSN_UID (v->insn), INSN_UID (tv->insn));
  2866.         }
  2867.         }
  2868.  
  2869.       /* Decide whether to strength-reduce this giv
  2870.          or to leave the code unchanged
  2871.          (recompute it from the biv each time it is used).
  2872.          This decision can be made independently for each giv.  */
  2873.  
  2874.       /* ??? Perhaps attempt to guess whether autoincrement will handle
  2875.          some of the new add insns; if so, can increase BENEFIT
  2876.          (undo the subtraction of ADD_BENEFIT that was done above).  */
  2877.  
  2878.       /* If an insn is not to be strength reduced, then set its ignore
  2879.          flag, and clear all_reduced.  */
  2880.  
  2881.       /* Is it right to consider times_used?  */
  2882.  
  2883.       /* ??? What about the insns that are 'forced' by this one?
  2884.          Although this insn is not worthwhile to reduce, it may be
  2885.          worthwhile to reduce the simpler givs used to compute this 
  2886.          complex giv.  */
  2887.  
  2888.       /* ??? Hey! If a giv has its forces field set, then that means
  2889.          it is not computed directly from the biv, it is instead computed
  2890.          from a simpler giv.  If we define UNFORCE_INSNS, then the simpler
  2891.          giv will be considered for strength reduction, and this giv should
  2892.          not cause all_reduced to be cleared because it DOESN'T use the
  2893.          biv!!!  If the simpler giv can not be reduced, then that simpler
  2894.          biv will still cause all_reduced to be cleared.  */
  2895.  
  2896.       if (benefit <= 0)
  2897.         {
  2898.           if (loop_dump_stream)
  2899.         fprintf (loop_dump_stream, "giv of insn %d, no benefit\n",
  2900.              INSN_UID (v->insn));
  2901.           v->ignore = 1;
  2902.           all_reduced = 0;
  2903.         }
  2904.  
  2905.       if (v->lifetime * threshold * benefit < insn_count)
  2906.         {
  2907.           if (loop_dump_stream)
  2908.         fprintf (loop_dump_stream,
  2909.              "giv of insn %d not worth while, %d vs %d.\n",
  2910.              INSN_UID (v->insn),
  2911.              v->lifetime * threshold * benefit, insn_count);
  2912.           v->ignore = 1;
  2913.           all_reduced = 0;
  2914.         }
  2915.  
  2916.       /* Now check that we can increment the reduced giv
  2917.          without needing a multiply insn.  If not, reject it.  */
  2918.  
  2919.       if (! v->ignore)
  2920.         {
  2921.           int success = 1;
  2922.  
  2923.           for (tv = bl->biv; tv; tv = tv->family)
  2924.         if (tv->mult_val == const1_rtx)
  2925.           success &= product_cheap_p (tv->add_val, v->mult_val);
  2926.  
  2927.           if (! success)
  2928.         {
  2929.           if (loop_dump_stream)
  2930.             fprintf (loop_dump_stream,
  2931.                  "giv of insn %d: would need a multiply.\n",
  2932.                  INSN_UID (v->insn));
  2933.           v->ignore = 1;
  2934.           all_reduced = 0;
  2935.         }
  2936.         }
  2937.     }
  2938.  
  2939.       /* Reduce each giv that we decided to reduce.  */
  2940.  
  2941.       for (v = bl->giv; v; v = v->family)
  2942.     {
  2943.       struct induction *tv;
  2944.       if (! v->ignore)
  2945.         {
  2946.           rtx new_reg;
  2947.  
  2948.           /* Note Iris compiler dies if ?: is used inside gen_reg_rtx. */
  2949.           if (v->giv_type == DEST_ADDR)
  2950.             new_reg = gen_reg_rtx (Pmode);
  2951.           else
  2952.             new_reg = gen_reg_rtx (GET_MODE (SET_DEST (PATTERN (v->insn))));
  2953.  
  2954.           /* For each place where the biv is incremented,
  2955.          add an insn to increment the new, reduced reg for the giv.
  2956.          Insert it before the insn that sets the biv,
  2957.          so that the biv increment remains last before the endtest,
  2958.          so that dbra will still be recognized.  */
  2959.  
  2960.           for (tv = bl->biv; tv; tv = tv->family)
  2961.         {
  2962.           struct induction *iv;
  2963.           rtx before_insn = tv->insn;
  2964.  
  2965.           /* If this increment is between the setting of the giv and
  2966.              its use, don't increment until after the use.  */
  2967.           for (iv = v; iv; iv = iv->same)
  2968.             {
  2969.               if (INSN_LUID (tv->insn) <= INSN_LUID (iv->insn)
  2970.               && ((iv->forces
  2971.                    && (INSN_LUID (tv->insn)
  2972.                    >= INSN_LUID (iv->forces->insn))
  2973.                   || (iv->forces2
  2974.                   && (INSN_LUID (tv->insn)
  2975.                       >= INSN_LUID (iv->forces2->insn))))))
  2976.             {
  2977.               before_insn = NEXT_INSN (iv->insn);
  2978.               break;
  2979.             }
  2980.             }
  2981.  
  2982.           if (tv->mult_val == const1_rtx)
  2983.             emit_iv_inc (tv->add_val, v->mult_val,
  2984.                  new_reg, before_insn);
  2985.           else /* tv->mult_val == const0_rtx */
  2986.             /* A multiply is acceptable here
  2987.                since this is presumed to be seldom executed.  */
  2988.             emit_iv_init_code (tv->add_val, v->mult_val,
  2989.                        v->add_val, new_reg, before_insn);
  2990.         }
  2991.  
  2992.           /* Add code at loop start to initialize giv's reduced reg.  */
  2993.  
  2994.           emit_iv_init_code (bl->initial_value, v->mult_val,
  2995.                  v->add_val, new_reg, loop_start);
  2996.           /* If the initial value uses a register,
  2997.          then we may have just extended its range of appearance.
  2998.          Update this conservatively for the sake of outer loops.  */
  2999.           if (GET_CODE (bl->initial_value) == REG
  3000.           && (uid_luid[regno_last_uid[REGNO (bl->initial_value)]]
  3001.               < INSN_LUID (loop_start)))
  3002.         uid_luid[regno_last_uid[REGNO (bl->initial_value)]]
  3003.           = INSN_LUID (loop_start);
  3004.  
  3005.           /* For each giv register that can be reduced now:
  3006.          delete old insn that modifies the giv,
  3007.          if replaceable, substitute reduced reg
  3008.            wherever the old giv occurs;
  3009.          else add new move insn "giv_reg = reduced_reg".  */
  3010.  
  3011.           for (tv = v; tv; tv = tv->same)
  3012.         {
  3013.           /* Record the identity of the reduced reg.  */
  3014.           tv->new_reg = new_reg;
  3015.  
  3016.           if (tv->giv_type == DEST_ADDR)
  3017.             {
  3018.               /* Store reduced reg as the address in the memref
  3019.              where we found this giv.  */
  3020.               * tv->location = new_reg;
  3021.             }
  3022.           else if (tv->replaceable)
  3023.             {
  3024.               reg_map[tv->dest_regno] = new_reg;
  3025.               /* If giv lives after end of loop,
  3026.              emit insn to copy reduced reg into old reg,
  3027.              at the end of the loop.
  3028.              ?? insufficient; used before loop could
  3029.              mean live after loop, due to surrounding loop.  */
  3030.               /* Currently a giv used outside
  3031.              the loop will not be marked replaceable,
  3032.              so these deficiencies don't really hurt.  */
  3033.               if (uid_luid[regno_last_uid[tv->dest_regno]]
  3034.               > uid_luid[INSN_UID (loop_end)])
  3035.             {
  3036.               /* ?? This won't work.  We need to do this at
  3037.                  ALL exits.  */
  3038.               emit_insn_after (gen_rtx (SET, VOIDmode,
  3039.                             SET_DEST (PATTERN (tv->insn)),
  3040.                             new_reg),
  3041.                        loop_end);
  3042.               abort ();
  3043.             }
  3044.             }
  3045.           else
  3046.             {
  3047.               /* Not replaceable; emit an insn to set the
  3048.              original giv reg from the reduced giv.  */
  3049.  
  3050.               int count;
  3051.               rtx after_insn = tv->insn;
  3052.  
  3053.               for (count = tv->consec; count > 0; count--)
  3054.             after_insn = next_real_insn (after_insn);
  3055.  
  3056.               /* Put new insn after, not before, in case
  3057.              after_insn is the end of a libcall.  */
  3058.               emit_insn_after (gen_rtx (SET, VOIDmode,
  3059.                         SET_DEST (PATTERN (tv->insn)),
  3060.                         new_reg),
  3061.                        after_insn);
  3062.             }
  3063.  
  3064.           /* Delete the insn that used to set the old giv reg,
  3065.              unless we modified an address in it.
  3066.              In any case, delete the other insns used for this one.  */
  3067.           delete_insn_forces (tv, tv->giv_type != DEST_ADDR);
  3068.  
  3069.           if (loop_dump_stream)
  3070.             fprintf (loop_dump_stream, "giv at %d reduced to reg %d\n",
  3071.                  INSN_UID (tv->insn), REGNO (new_reg));
  3072.         }
  3073.           /* One set of equivalent givs has been strength-reduced.  */
  3074.         }
  3075. #if 0
  3076.       else if (v->new_reg == 0)
  3077.         {
  3078.           /* This giv wasn't reduced and is not worth reducing.  */
  3079.  
  3080.           for (tv = v; tv; tv = tv->same)
  3081.         if (loop_dump_stream)
  3082.           fprintf (loop_dump_stream, "giv at %d not reduced\n",
  3083.                INSN_UID (tv->insn));
  3084.  
  3085.           all_reduced = 0;
  3086.         }
  3087. #endif
  3088.     }
  3089.  
  3090.       /* All the givs in this family have been reduced if they merit it.  */
  3091.  
  3092.       /* Try to eliminate the biv, if it is a candidate.
  3093.      This won't work if ! all_reduced,
  3094.      since the givs we planned to use might not have been reduced.  */
  3095.  
  3096.       if (all_reduced == 1 && bl->eliminable)
  3097.     {
  3098.       /* Get the REG rtx for the biv.  */
  3099.       rtx reg = SET_DEST (PATTERN (bl->biv->insn));
  3100.  
  3101.       for (p = loop_start; p != end; p = NEXT_INSN (p))
  3102.         {
  3103.           enum rtx_code code = GET_CODE (p);
  3104.           if ((code == INSN || code == JUMP_INSN || code == CALL_INSN)
  3105.           && reg_mentioned_p (reg, PATTERN (p))
  3106.           && SET_DEST (PATTERN (p)) == cc0_rtx)
  3107.         /* Found a compare instruction using this biv;
  3108.            rewrite it to use a related giv.  */
  3109.         {
  3110.           struct induction *v1;
  3111.           /* If this is an insn which uses the biv ONLY in the
  3112.              calculation of a giv which is in the family of this
  3113.              biv, it's ok becuase it will go away when the giv is
  3114.              reduced.  */
  3115.           for (v1 = bl->giv; v1; v1 = v1->family)
  3116.             if (v1->insn == p)
  3117.               {
  3118.             if (v1->giv_type == DEST_REG
  3119.                 || (v1->giv_type == DEST_ADDR
  3120.                 /* Test was backwards - rms, 5 Dec 89 */
  3121.                 && only_reg_use_p (reg, *(v1->location),
  3122.                            PATTERN (p))))
  3123.               break;
  3124.               }
  3125.           if (!v1)
  3126.             eliminate_biv (p, bl, loop_start);
  3127.         }
  3128.         }
  3129.  
  3130.       /* Biv is no longer really needed inside the loop,
  3131.          so delete all insns that set the biv.  */
  3132.  
  3133.       for (v = bl->biv; v; v = v->family)
  3134.         delete_insn (v->insn);
  3135.  
  3136.       /* ?? If we created a new test to bypass the loop entirely,
  3137.          or otherwise drop straight in, based on this test, then
  3138.          we might want to rewrite it also.  This way some later
  3139.          pass has more hope of removing the intialization of this
  3140.          biv entirely. */
  3141.  
  3142.       /* If final_value != 0, then biv may be used after loop end
  3143.          and we must emit an insn to set it just in case.  */
  3144.       if (final_value != 0)
  3145.         emit_insn_after (gen_rtx (SET, VOIDmode, reg, final_value),
  3146.                  loop_end);
  3147.  
  3148.       if (loop_dump_stream)
  3149.         fprintf (loop_dump_stream, "Reg %d: biv eliminated\n",
  3150.              bl->regno);
  3151.     }
  3152.     }
  3153.  
  3154.   /* Go through all the instructions in the loop, making all the
  3155.      register substitutions scheduled in REG_MAP.  */
  3156.  
  3157.   for (p = loop_start; p != end; p = NEXT_INSN (p))
  3158.     if (GET_CODE (p) == INSN || GET_CODE (p) == JUMP_INSN
  3159.      || GET_CODE (p) == CALL_INSN)
  3160.       replace_regs (PATTERN (p), reg_map, nregs);
  3161.  
  3162.   if (loop_dump_stream)
  3163.     fprintf (loop_dump_stream, "\n");
  3164. }
  3165.  
  3166. /* Nonzero if register REG appears somewhere within IN, except in
  3167.    subexpressions EQ to EXPR.  This is a modification of reg_mentioned_p.  */
  3168.  
  3169. int
  3170. only_reg_use_p (reg, expr, in)
  3171.      register rtx reg, expr, in;
  3172. {
  3173.   register char *fmt;
  3174.   register int i;
  3175.   register enum rtx_code code;
  3176.  
  3177.   if (in == 0)
  3178.     return 0;
  3179.  
  3180.   if (reg == expr)
  3181.     return 0;
  3182.  
  3183.   if (reg == in)
  3184.     return 1;
  3185.  
  3186.   code = GET_CODE (in);
  3187.  
  3188.   switch (code)
  3189.     {
  3190.       /* Compare registers by number.  */
  3191.     case REG:
  3192.       return GET_CODE (reg) == REG && REGNO (in) == REGNO (reg);
  3193.  
  3194.       /* These codes have no constituent expressions
  3195.      and are unique.  */
  3196.     case CC0:
  3197.     case PC:
  3198.     case CONST_INT:
  3199.     case CONST_DOUBLE:
  3200.     case SYMBOL_REF:
  3201.     case CODE_LABEL:
  3202.       return 0;
  3203.     }
  3204.  
  3205.   fmt = GET_RTX_FORMAT (code);
  3206.  
  3207.   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
  3208.     {
  3209.       if (fmt[i] == 'E')
  3210.     {
  3211.       register int j;
  3212.       for (j = XVECLEN (in, i) - 1; j >= 0; j--)
  3213.         if (only_reg_use_p (reg, expr, XVECEXP (in, i, j)))
  3214.           return 1;
  3215.     }
  3216.       else if (fmt[i] == 'e'
  3217.            && only_reg_use_p (reg, expr, XEXP (in, i)))
  3218.     return 1;
  3219.     }
  3220.   return 0;
  3221. }
  3222.  
  3223. /* Scan X for memory refs and check each memory address
  3224.    as a possible giv.  INSN is the insn whose pattern X comes from.
  3225.    MAYBE_NEVER is 1 if the loop might execute INSN zero times.  */
  3226.  
  3227. static void
  3228. find_mem_givs (x, insn, maybe_never, loop_end)
  3229.      rtx x;
  3230.      rtx insn;
  3231.      int maybe_never;
  3232.      rtx loop_end;
  3233. {
  3234.   register int i, j;
  3235.   register enum rtx_code code;
  3236.   register char *fmt;
  3237.  
  3238.   if (x == 0)
  3239.     return;
  3240.  
  3241.   code = GET_CODE (x);
  3242.   switch (code)
  3243.     {
  3244.     case REG:
  3245.     case CONST_INT:
  3246.     case CONST:
  3247.     case CONST_DOUBLE:
  3248.     case SYMBOL_REF:
  3249.     case LABEL_REF:
  3250.     case PC:
  3251.     case CC0:
  3252.     case ADDR_VEC:
  3253.     case ADDR_DIFF_VEC:
  3254.     case USE:
  3255.     case CLOBBER:
  3256.       return;
  3257.  
  3258.     case MEM:
  3259.       {
  3260.     int src_regno;
  3261.     rtx add_val;
  3262.     rtx mult_val;
  3263.     int benefit;
  3264.     struct induction *forces = 0;
  3265.     struct induction *forces2 = 0;
  3266.  
  3267.     benefit = general_induction_var (XEXP (x, 0),
  3268.                      &src_regno, &add_val, &mult_val,
  3269.                      &forces, &forces2);
  3270.     if (benefit > 0)
  3271.       {
  3272.         /* Found one; record it.  */
  3273.         struct induction *v =
  3274.           (struct induction *) oballoc (sizeof (struct induction));
  3275.  
  3276.         record_giv (v, insn, src_regno, 0, mult_val, add_val, benefit,
  3277.             forces, forces2, DEST_ADDR, maybe_never, &XEXP (x, 0),
  3278.             loop_end);
  3279.       }
  3280.     return;
  3281.       }
  3282.     }
  3283.  
  3284.   /* Recursively scan the subexpressions for other mem refs.  */
  3285.  
  3286.   fmt = GET_RTX_FORMAT (code);
  3287.   for (i = GET_RTX_LENGTH (code) - 1; i >= 0; i--)
  3288.     if (fmt[i] == 'e')
  3289.       find_mem_givs (XEXP (x, i), insn, maybe_never, loop_end);
  3290.     else if (fmt[i] == 'E')
  3291.       for (j = 0; j < XVECLEN (x, i); j++)
  3292.     find_mem_givs (XVECEXP (x, i, j), insn, maybe_never, loop_end);
  3293. }
  3294.  
  3295. /* Fill in the data about one giv.
  3296.    V is the `struct induction' in which we record the giv.  (It is
  3297.    allocated by the caller, with alloca.)
  3298.    INSN is the insn that sets it.
  3299.    BENEFIT estimates the savings from deleting this insn.
  3300.    TYPE is DEST_REG or DEST_ADDR; it says whether the giv is computed
  3301.    into a register or is used as a memory address.
  3302.  
  3303.    SRC_REGNO is the biv reg number which the giv is computed from.
  3304.    DEST_REGNO is the giv's reg number (if the giv is stored in a reg).
  3305.    MULT_VAL and ADD_VAL are the coefficients used to compute the giv.
  3306.    FORCES and FORCES2, if nonzero, are other `struct induction's for
  3307.    other givs which are used to compute this giv indirectly.
  3308.    LOCATION points to the place where this giv's value appears in INSN.  */
  3309.  
  3310. static void
  3311. record_giv (v, insn, src_regno, dest_regno, mult_val, add_val, benefit,
  3312.         forces, forces2, type, maybe_never, location, loop_end)
  3313.      struct induction *v;
  3314.      rtx insn;
  3315.      int src_regno, dest_regno;
  3316.      rtx mult_val, add_val;
  3317.      int benefit;
  3318.      struct induction *forces, *forces2;
  3319.      enum g_types type;
  3320.      int maybe_never;
  3321.      rtx *location;
  3322.      rtx loop_end;
  3323. {
  3324.   struct induction *b;
  3325.   struct iv_class *bl;
  3326.  
  3327.   v->insn = insn;
  3328.   v->src_regno = src_regno;
  3329.   v->giv_type = type;
  3330.   v->dest_regno = dest_regno;
  3331.   v->mult_val = mult_val;
  3332.   v->add_val = add_val;
  3333.   v->benefit = benefit;
  3334.   v->location = location;
  3335.  
  3336.   if (type == DEST_ADDR)
  3337.     {
  3338.       v->mode = GET_MODE (*location);
  3339.       v->consec = 0;
  3340.       v->lifetime = 1;
  3341.       v->times_used = 1;
  3342.     }
  3343.   else /* type == DEST_REG */
  3344.     {
  3345.       v->mode = GET_MODE (SET_DEST (PATTERN (insn)));
  3346.       v->consec = n_times_set[dest_regno] - 1;
  3347.       v->lifetime = (uid_luid[regno_last_uid[dest_regno]]
  3348.              - uid_luid[regno_first_uid[dest_regno]]);
  3349.       v->times_used = n_times_used[dest_regno];
  3350.     }
  3351.  
  3352.   v->same = 0;
  3353.   v->forces = 0;
  3354.   v->forces2 = 0;
  3355.   v->ignore = 0;
  3356.   v->new_reg = 0;
  3357.  
  3358.   /* Mark giv as forced if it is only used to compute another giv.  */
  3359.  
  3360.   /* This check is not sufficient as INSN may have been moved giving
  3361.      it a new uid, so make another check by calculating lifetimes.
  3362.      This is overconservative but seems to be correct.  */
  3363.  
  3364.   if (forces)
  3365.     {
  3366.       v->benefit += forces->benefit;
  3367.       if ((regno_last_uid[forces->dest_regno] == INSN_UID (insn)
  3368.        ||
  3369.        ((uid_luid[regno_last_uid[forces->dest_regno]]
  3370.          - uid_luid[regno_first_uid[forces->dest_regno]])
  3371.         == (INSN_LUID (insn) - INSN_LUID (forces->insn))))
  3372.       && !reg_used_between_p (SET_DEST (PATTERN (forces->insn)),
  3373.                   forces->insn, insn))
  3374.      {
  3375.       v->forces = forces;
  3376.       forces->ignore = 1;
  3377.      }
  3378.     }
  3379.  
  3380.   if (forces2)
  3381.     {
  3382.       v->benefit += forces2->benefit;
  3383.       if ((regno_last_uid[forces2->dest_regno] == INSN_UID (insn)
  3384.        ||
  3385.        ((uid_luid[regno_last_uid[forces2->dest_regno]]
  3386.          - uid_luid[regno_first_uid[forces2->dest_regno]])
  3387.         == (INSN_LUID (insn) - INSN_LUID (forces2->insn))))
  3388.       && !reg_used_between_p (SET_DEST (PATTERN (forces2->insn)),
  3389.                   forces2->insn, insn))
  3390.      {
  3391.       if (v->forces)
  3392.         v->forces2 = forces2;
  3393.       else
  3394.         v->forces = forces2;
  3395.       forces2->ignore = 1;
  3396.     }
  3397.     }
  3398.  
  3399.   if (type == DEST_REG)
  3400.     {
  3401.       induct_var[dest_regno] = GENERAL_INDUCT;
  3402.       induct_struct[dest_regno] = v;
  3403.     }
  3404.  
  3405.   /* Add the giv to the class of givs computed from one biv.  */
  3406.  
  3407.   bl = class_struct[src_regno];
  3408.   if (bl)
  3409.     {
  3410.       v->family = bl->giv;
  3411.       bl->giv = v;
  3412.       /* Don't count DEST_ADDR.  This is supposed to count the number of
  3413.      insns that calculate givs.  */
  3414.       if (type == DEST_REG)
  3415.     bl->giv_count++;
  3416.       bl->total_benefit += benefit;
  3417.     }
  3418.   else
  3419.     /* Fatal error, biv missing for this giv?  */
  3420.     abort ();
  3421.  
  3422.   if (type == DEST_ADDR)
  3423.     v->replaceable = 1;
  3424.   else
  3425.     {
  3426.       /* The giv can be replaced outright by the reduced register if
  3427.       - the insn that sets the giv is always executed on any iteration
  3428.        on which the giv is used at all
  3429.        (there are two ways to deduce this:
  3430.         either the insn is executed on every iteration,
  3431.         or all uses follow that insn in the same basic block),
  3432.       - the giv is not used before the insn that sets it,
  3433.          i.e. no definition outside loop reaches into loop
  3434.      - no assignments to the biv occur during the giv's lifetime.  */
  3435.  
  3436.       /* Is this right?  Don't we need to make sure the giv is not used
  3437.      outside the loop.  Someday we will know where all the loop exits
  3438.      are so we can do better, but until then....
  3439.      March 18, 1989 -- self@bayes.arc.nasa.gov */
  3440.  
  3441.       if (regno_first_uid[dest_regno] == INSN_UID (insn)
  3442.       /* Previous line always fails if INSN was moved by loop opt.  */
  3443.       && uid_luid[regno_last_uid[dest_regno]] < INSN_LUID (loop_end)
  3444.       && (!maybe_never || last_use_this_basic_block (dest_regno, insn)))
  3445.      {
  3446.       v->replaceable = 1;
  3447.       for (b = bl->biv; b; b = b->family)
  3448.         {
  3449.           if ((uid_luid[INSN_UID (b->insn)] >= uid_luid[regno_first_uid[dest_regno]])
  3450.           &&
  3451.           (uid_luid[INSN_UID (b->insn)]
  3452.            <= uid_luid[regno_last_uid[dest_regno]]))
  3453.         {
  3454.           v->replaceable = 0;
  3455.           break;
  3456.          }
  3457.         }
  3458.     }
  3459.       else
  3460.      v->replaceable = 0;
  3461.     }
  3462.  
  3463.   if (loop_dump_stream)
  3464.     {
  3465.       if (type == DEST_REG)
  3466.      fprintf (loop_dump_stream, "Insn %d: giv reg %d",
  3467.          INSN_UID (insn), dest_regno);
  3468.       else
  3469.      fprintf (loop_dump_stream, "Insn %d: dest address",
  3470.           INSN_UID (insn));
  3471.  
  3472.       fprintf (loop_dump_stream, " src reg %d benefit %d",
  3473.            src_regno, v->benefit);
  3474.       fprintf (loop_dump_stream, " used %d lifetime %d",
  3475.            v->times_used, v->lifetime);
  3476.  
  3477.       if (v->replaceable)
  3478.      fprintf (loop_dump_stream, " replaceable");
  3479.  
  3480.       if (GET_CODE (mult_val) == CONST_INT)
  3481.     fprintf (loop_dump_stream, " mult %d",
  3482.           INTVAL (mult_val));
  3483.       else
  3484.     {
  3485.       fprintf (loop_dump_stream, " mult ");
  3486.       print_rtl (loop_dump_stream, mult_val);
  3487.     }
  3488.  
  3489.       if (GET_CODE (add_val) == CONST_INT)
  3490.     fprintf (loop_dump_stream, " add %d",
  3491.          INTVAL (add_val));
  3492.       else
  3493.     {
  3494.       fprintf (loop_dump_stream, " add ");
  3495.       print_rtl (loop_dump_stream, add_val);
  3496.     }
  3497.     }
  3498.  
  3499.   if (loop_dump_stream && v->forces)
  3500.     fprintf (loop_dump_stream, " forces insn %d", INSN_UID (v->forces->insn));
  3501.   if (loop_dump_stream && v->forces2)
  3502.     fprintf (loop_dump_stream, " forces insn %d", INSN_UID (v->forces2->insn));
  3503.   if (loop_dump_stream && v->consec)
  3504.     fprintf (loop_dump_stream, " consec %d", v->consec);
  3505.   if (loop_dump_stream)
  3506.     fprintf (loop_dump_stream, "\n");
  3507. }
  3508.  
  3509. /* Delete the insns forced by the insn described by V.
  3510.    If THIS_TOO is nonzero, delete that insn itself as well.  */
  3511.  
  3512. static void
  3513. delete_insn_forces (v, this_too)
  3514.      struct induction *v;
  3515.      int this_too;
  3516. {
  3517.   rtx x, p;
  3518.   int count;
  3519.   rtx insn;
  3520.  
  3521.   if (this_too)
  3522.     {
  3523.       insn = v->insn;
  3524.       for (count = v->consec; count >= 0; count--)
  3525.     {
  3526.       /* If first insn of libcall sequence, skip to end.  */
  3527.       /* Do this at start of loop, since p is guaranteed to
  3528.          be an insn here.  */
  3529.       if (x = find_reg_note (insn, REG_LIBCALL, 0))
  3530.         insn = XEXP (x, 0);
  3531.  
  3532.       if (x = find_reg_note (insn, REG_RETVAL, 0))
  3533.         {
  3534.           /* This is a library call; delete all insns backward until get to
  3535.          first insn in this group.  */
  3536.           rtx first = XEXP (x, 0);
  3537.           for (p = insn; p != first; p = PREV_INSN (p))
  3538.         delete_insn (p);
  3539.           /* Delete first insn also.  */
  3540.           delete_insn (p);
  3541.         }
  3542.       else
  3543.         delete_insn (insn);
  3544.  
  3545.       do insn = NEXT_INSN (insn);
  3546.       while (GET_CODE (insn) == NOTE);
  3547.     }
  3548.     }
  3549.  
  3550.   if (v->forces)
  3551.     delete_insn_forces (v->forces, 1);
  3552.   if (v->forces2)
  3553.     delete_insn_forces (v->forces2, 1);
  3554. }
  3555.  
  3556. /* Check whether an insn is an increment legitimate for a basic induction var.
  3557.    X is the source of the insn.
  3558.    DEST_REG is the putative biv, also the destination of the insn.
  3559.    We accept patterns of these forms:
  3560.      REG = REG + INVARIANT
  3561.      REG = INVARIANT + REG
  3562.      REG = REG - CONSTANT
  3563.  
  3564.    If X is suitable, we return 1,
  3565.    and store the factor multiplying REF in X into *MULT_VAL
  3566.    and the additive term into *INC_VAL.
  3567.    Otherwise we return 0.  */
  3568.  
  3569. static int
  3570. basic_induction_var (x, dest_regno, inc_val, mult_val)
  3571.      register rtx x;
  3572.      int dest_regno;
  3573.      rtx *inc_val;
  3574.      rtx *mult_val;
  3575. {
  3576.   register enum rtx_code code;
  3577.   rtx arg;
  3578.  
  3579.   if (x == 0)
  3580.     return 0;
  3581.   code = GET_CODE (x);
  3582.   switch (code)
  3583.     {
  3584.     case PLUS:
  3585.       if (GET_CODE (XEXP (x, 0)) == REG
  3586.       && REGNO (XEXP (x, 0)) == dest_regno)
  3587.      arg = XEXP (x, 1);
  3588.       else if (GET_CODE (XEXP (x, 1)) == REG
  3589.            && REGNO (XEXP (x, 1)) == dest_regno)
  3590.     arg = XEXP (x, 0);
  3591.       else
  3592.      return 0;
  3593.  
  3594.       if (invariant_p (arg) == 1)
  3595.     *inc_val = arg;
  3596.       else
  3597.     return 0;
  3598.  
  3599.       *mult_val = const1_rtx;
  3600.       return 1;
  3601.  
  3602.     case MINUS:
  3603.       if (GET_CODE (XEXP (x, 0)) == REG
  3604.        && REGNO (XEXP (x, 0)) == dest_regno
  3605.        && GET_CODE (XEXP (x, 1)) == CONST_INT)
  3606.      *inc_val = gen_rtx (CONST_INT, VOIDmode,
  3607.                 - INTVAL (XEXP (x, 1)));
  3608.       else
  3609.      return 0;
  3610.       *mult_val = const1_rtx;
  3611.       return 1;
  3612.  
  3613.       /* Can accept constant setting of biv only when inside inner most loop.
  3614.        Otherwise, a biv of an inner loop may be incorrectly recognized
  3615.      as a biv of the outer loop,
  3616.      causing code to be moved INTO the inner loop.  */
  3617.     case REG:
  3618.       if (!invariant_p (x))
  3619.     return 0;
  3620.     case CONST_INT:
  3621.     case SYMBOL_REF:
  3622.     case CONST:
  3623.       if (loops_enclosed == 1)
  3624.      {
  3625.       *inc_val = x;
  3626.        *mult_val = const0_rtx;
  3627.        return 1;
  3628.      }
  3629.       else
  3630.      return 0;
  3631.  
  3632.     default:
  3633.       return 0;
  3634.     }
  3635. }
  3636.  
  3637. /* A general induction variable (giv) is any quantity that is a linear function
  3638.    of a basic induction variable, i.e. giv = biv * mult_val + add_val.
  3639.    The coefficients can be any loop invariant quantity.
  3640.    A giv need not be computed directly from the biv;
  3641.    it can be computed by way of other givs.  */
  3642.  
  3643. /* Determine whether X computes a giv.
  3644.    If it does, return a nonzero value
  3645.      which is the benefit from eliminating the computation of X;
  3646.    set *SRC_REGNO to the register number of the biv that it is computed from;
  3647.    set *ADD_VAL and *MULT_VAL to the coefficients,
  3648.      such that the value of X is biv * mult + add;
  3649.    set forces (and forces2) to identify any other givs that are used
  3650.      solely to compute this one.  */
  3651.  
  3652. /* This routine recognizes four types of patterns that generate givs:
  3653.    - giv = biv op invariant             v = 0,    g = 0
  3654.    - giv1 = giv2 op invariant           v = 0,    g = giv2
  3655.        where giv1 and giv2 are functions of the same biv
  3656.    - giv1 = biv op giv2                 v = giv2, g = 0
  3657.        where giv2 is a function of biv
  3658.    - giv1 = giv2 op giv3                v = giv3, g = giv2
  3659.        where giv2 and giv3 are functions of the save biv  */
  3660.  
  3661. static int
  3662. general_induction_var (x, src_regno, add_val, mult_val, forces, forces2)
  3663.      rtx x;
  3664.      int *src_regno;
  3665.      rtx *add_val;
  3666.      rtx *mult_val;
  3667.      struct induction **forces;
  3668.      struct induction **forces2;
  3669. {
  3670.   register enum rtx_code code;
  3671.   rtx arg;
  3672.   struct induction *g = 0;
  3673.   struct induction *v = 0;
  3674.   int subexp = 0;
  3675.   int tem;
  3676.  
  3677.   if (x == 0)
  3678.     return 0;
  3679.  
  3680.   code = GET_CODE (x);
  3681.   switch (code)
  3682.     {
  3683.     case NEG:
  3684.       /* This can generate givs also, but it is not handled.  */
  3685.       return 0;
  3686.  
  3687.     case MULT:
  3688.     case UMULT:
  3689.       /* Reject widening multiply in version 1.
  3690.      That is safer than trying to handle it.  */
  3691.       {
  3692.     enum machine_mode m0 = GET_MODE (XEXP (x, 0));
  3693.     enum machine_mode m1 = GET_MODE (XEXP (x, 1));
  3694.     if (m0 != VOIDmode && m0 != GET_MODE (x))
  3695.       return 0;
  3696.     if (m1 != VOIDmode && m1 != GET_MODE (x))
  3697.       return 0;
  3698.       }
  3699.     case PLUS:
  3700.     case MINUS:
  3701.       /* Result is linear in both operands.  */
  3702.       /* Determine which operand is the biv, and put the other in ARG.  */
  3703.       if (GET_CODE (XEXP (x, 0)) == REG
  3704.       && induct_var[REGNO (XEXP (x, 0))] == BASIC_INDUCT)
  3705.     {
  3706.       *src_regno = REGNO (XEXP (x, 0));
  3707.       arg = XEXP (x, 1);
  3708.  
  3709.     }
  3710.       else if (GET_CODE (XEXP (x, 1)) == REG
  3711.            && induct_var[REGNO (XEXP (x, 1))] == BASIC_INDUCT)
  3712.     {
  3713.       *src_regno = REGNO (XEXP (x, 1));
  3714.       arg = XEXP (x, 0);
  3715.  
  3716.     }
  3717.       /* Check for an rtl subexpression that is a giv.  Memory address
  3718.      givs often look like (plus (reg) (mult (biv) (const))).  */
  3719.       /* Do this before checking for a giv operand, as this function will
  3720.      fail if this special operand is not recognized.  */
  3721. #ifndef DONT_REDUCE_ADDR
  3722.       else if (tem = general_induction_var (XEXP (x, 1), src_regno,
  3723.                         add_val, mult_val,
  3724.                         forces, forces2)
  3725.            && code != MINUS)
  3726.     {
  3727.       /* Set subexp true so that this can be handled a little
  3728.          differently from the normal case of g set.  */
  3729.       /* Note that SRC_REGNO is already set.  */
  3730.       subexp = TRUE;
  3731.       g = (struct induction *) alloca (sizeof (struct induction));
  3732.       g->mult_val = *mult_val;
  3733.       g->add_val = *add_val;
  3734.       /* Fake out the test below.  */
  3735.       g->replaceable = 1;
  3736.       /* Count this multiply as a shift, since that's what it
  3737.          really will do.  */
  3738.       if (tem == MULT_BENEFIT)
  3739.         g->benefit = SHIFT_BENEFIT;
  3740.       else
  3741.         g->benefit = tem;
  3742.       arg = XEXP (x, 0);
  3743.     }
  3744.       else if (tem = general_induction_var (XEXP (x, 0), src_regno,
  3745.                         add_val, mult_val,
  3746.                         forces, forces2))
  3747.     {
  3748.       /* Set subexp true so that this can be handled a little
  3749.          differently from the normal case of g set.  */
  3750.       /* Note that SRC_REGNO is already set.  */
  3751.       subexp = TRUE;
  3752.       g = (struct induction *) alloca (sizeof (struct induction));
  3753.       g->mult_val = *mult_val;
  3754.       g->add_val = *add_val;
  3755.       /* Fake out the test below.  */
  3756.       g->replaceable = 1;
  3757.       /* Count this multiply as a shift, since that's what it
  3758.          really will do.  */
  3759.       if (tem == MULT_BENEFIT)
  3760.         g->benefit = SHIFT_BENEFIT;
  3761.       else
  3762.         g->benefit = tem;
  3763.       arg = XEXP (x, 1);
  3764.     }
  3765. #endif
  3766.       /* Also allow general induction variables.
  3767.      Could have a mult followed by an add (i.e. an address calculation),
  3768.      thereby generating two related general induction variables
  3769.      of which only the second is actually used.  */
  3770.       /* Do this after checking both args for basic induction variables.  */
  3771.       else if (GET_CODE (XEXP (x, 0)) == REG
  3772.            && induct_var[REGNO (XEXP (x, 0))] == GENERAL_INDUCT)
  3773.     {
  3774.       g = induct_struct[REGNO (XEXP (x, 0))];
  3775.       *src_regno = g->src_regno;
  3776.       arg = XEXP (x, 1);
  3777.     }
  3778.       else if (GET_CODE (XEXP (x, 1)) == REG
  3779.            && induct_var[REGNO (XEXP (x, 1))] == GENERAL_INDUCT
  3780.            && code != MINUS)
  3781.     {
  3782.       g = induct_struct[REGNO (XEXP (x, 1))];
  3783.       *src_regno = g->src_regno;
  3784.       arg = XEXP (x, 0);
  3785.     }
  3786.       else
  3787.     return 0;
  3788.  
  3789.       /* Overall form of expression looks good.  */
  3790.       break;
  3791.  
  3792.       /* Could handle these also.  */
  3793.     case DIV:
  3794.     case UDIV:
  3795.       /* For a 68020 could handle these? */
  3796.     case LSHIFT:
  3797.     case ASHIFT:
  3798.     case ASHIFTRT:
  3799.     case LSHIFTRT:
  3800.       /* These operations are linear only in first operand.
  3801.      Check for a biv or giv there; if found, put other operand in ARG.  */
  3802.       if (GET_CODE (XEXP (x, 0)) == REG
  3803.       && induct_var[REGNO (XEXP (x, 0))] == BASIC_INDUCT)
  3804.     {
  3805.       *src_regno = REGNO (XEXP (x, 0));
  3806.       arg = XEXP (x, 1);
  3807.     }
  3808.       /* Also allow general induction variable.  */
  3809.       else if (GET_CODE (XEXP (x, 0)) == REG
  3810.            && induct_var[REGNO (XEXP (x, 0))] == GENERAL_INDUCT)
  3811.     {
  3812.       g = induct_struct[REGNO (XEXP (x, 0))];
  3813.       *src_regno = g->src_regno;
  3814.       arg = XEXP (x, 1);
  3815.     }
  3816.       else
  3817.     return 0;
  3818.  
  3819.       /* Overall form of expression looks good.  */
  3820.       break;
  3821.  
  3822.     default:
  3823.       return 0;
  3824.     }
  3825.  
  3826.   /* ARG is the operand that is NOT a biv or giv.
  3827.      Test it for superficial validity.  */
  3828.  
  3829.   /* This is just a special case of invariant values,
  3830.      it is not really needed, but it's a shortcut.  */
  3831.   if (GET_CODE (arg) == CONST_INT)
  3832.     ;
  3833.  
  3834.   /* Depends on previous general induction variable, which has
  3835.      the same basic induction variable */
  3836.   /* This code detects mults that have been generated as shift and add.  */
  3837.   else if (GET_CODE (arg) == REG
  3838.        && induct_var[REGNO (arg)] == GENERAL_INDUCT
  3839.        && induct_struct[REGNO (arg)]->src_regno == *src_regno)
  3840.     {
  3841.       v = induct_struct[REGNO (arg)];
  3842.       /* Dependence indicated by forces, sort of kludgey.  */
  3843.     }
  3844.  
  3845.   /* Invariant expression, could be a constant-valued register. */
  3846.   else if (invariant_p (arg) == 1)
  3847.     ;
  3848.  
  3849.   /* Failure */
  3850.   else
  3851.     return 0;
  3852.     
  3853.   /* Until we can do the correct thing, suppress use of nonreplaceable givs
  3854.      as sources for other givs.  */
  3855.   if ((g && ! g->replaceable)
  3856.       || (v && ! v->replaceable))
  3857.     return 0;
  3858.  
  3859.   /* Now we know looks like a giv; extract the coefficients.
  3860.      We can still fail if the coefficients are not what we can handle.  */
  3861.  
  3862.   /* Only succeed if result mult_val and add_val are only one level of rtl,
  3863.      for example, (NEG:SI (REG:SI 34)) is not accepted.
  3864.      This mainly causes problems with the MINUS code.  */
  3865.  
  3866.   switch (code)
  3867.     {
  3868.     case PLUS:
  3869.       if (v && g)
  3870.     {
  3871.       if (GET_CODE (g->mult_val) == CONST_INT)
  3872.         {
  3873.           if (g->mult_val == const0_rtx)
  3874.         *mult_val = v->mult_val;
  3875.           else if (GET_CODE (v->mult_val) == CONST_INT)
  3876.         *mult_val = gen_rtx (CONST_INT, VOIDmode,
  3877.                        INTVAL (g->mult_val)
  3878.                        + INTVAL (v->mult_val));
  3879.           else
  3880.         return 0;
  3881.         }
  3882.       else if (v->mult_val == const0_rtx)
  3883.         *mult_val = g->mult_val;
  3884.       else
  3885.         return 0;
  3886.  
  3887.       if (GET_CODE (g->add_val) == CONST_INT)
  3888.         {
  3889.           if (g->add_val == const0_rtx)
  3890.         *add_val = v->add_val;
  3891.           else if (GET_CODE (v->add_val) == CONST_INT)
  3892.         *add_val = gen_rtx (CONST_INT, VOIDmode,
  3893.                        INTVAL (g->add_val)
  3894.                        + INTVAL (v->add_val));
  3895.           else
  3896.         return 0;
  3897.         }
  3898.       else if (v->add_val == const0_rtx)
  3899.         *add_val = g->add_val;
  3900.       else
  3901.         return 0;
  3902.  
  3903.       if (subexp)
  3904.         {
  3905.           /* g deleted when return, can't return pointer to it */
  3906.           if (*forces2 == 0)
  3907.         *forces2 = v;
  3908.           return ADD_BENEFIT + g->benefit;
  3909.         }
  3910.       else
  3911.         {
  3912.           *forces = g;
  3913.           *forces2 = v;
  3914.           return ADD_BENEFIT;
  3915.         }
  3916.     }
  3917.       else if (v)
  3918.     {
  3919.       if (GET_CODE (v->mult_val) == CONST_INT)
  3920.         *mult_val = gen_rtx (CONST_INT, VOIDmode,
  3921.                    INTVAL (v->mult_val) + 1);
  3922.       else
  3923.         return 0;
  3924.       *add_val = v->add_val;
  3925.       *forces = v;
  3926.       return ADD_BENEFIT;
  3927.     }
  3928.       else if (g)
  3929.     {
  3930.       *mult_val = g->mult_val;
  3931.       if (GET_CODE (g->add_val) == CONST_INT)
  3932.         *add_val = plus_constant (arg, INTVAL (g->add_val));
  3933.       else if (GET_CODE (arg) == CONST_INT)
  3934.         *add_val = plus_constant (g->add_val, INTVAL (arg));
  3935.       else
  3936.         /* Could succeed if arg == 0, but that will never occur.  */
  3937.         return 0;
  3938.  
  3939.       if (subexp)
  3940.         /* g deleted when return, can't return pointer to it */
  3941.         return ADD_BENEFIT + g->benefit;
  3942.       else
  3943.         {
  3944.           *forces = g;
  3945.           return ADD_BENEFIT;
  3946.         }
  3947.     }
  3948.       else
  3949.     {
  3950.       *mult_val = const1_rtx;
  3951.       *add_val = arg;
  3952.       return ADD_BENEFIT;
  3953.     }
  3954.  
  3955.       /* Takes a lot of code and will rarely succeed.  */
  3956.     case MINUS:
  3957.       if (v && g)
  3958.     {
  3959.       /* G is the first argument of MINUS.  */
  3960.  
  3961.       if (GET_CODE (g->mult_val) == CONST_INT)
  3962.         {
  3963.           if (g->mult_val == const0_rtx)
  3964. #if 0 /* Should not have to fail here */
  3965.         *mult_val = gen_rtx (NEG, SImode, v->mult_val);
  3966. #endif
  3967.         return 0;
  3968.           else if (GET_CODE (v->mult_val) == CONST_INT)
  3969.         *mult_val = gen_rtx (CONST_INT, VOIDmode,
  3970.                        INTVAL (g->mult_val)
  3971.                        - INTVAL (v->mult_val));
  3972.           else
  3973.         return 0;
  3974.         }
  3975.       else if (v->mult_val == const0_rtx)
  3976.         *mult_val = g->mult_val;
  3977.       else
  3978.         return 0;
  3979.  
  3980.       if (GET_CODE (g->add_val) == CONST_INT)
  3981.         {
  3982.           if (g->add_val == const0_rtx)
  3983. #if 0 /* should not have to fail here */
  3984.         *add_val = v->add_val;
  3985. #endif
  3986.         return 0;
  3987.           else if (GET_CODE (v->add_val) == CONST_INT)
  3988.         *add_val = gen_rtx (CONST_INT, VOIDmode,
  3989.                        INTVAL (g->add_val)
  3990.                        - INTVAL (v->add_val));
  3991.           else
  3992.         return 0;
  3993.         }
  3994.       else if (v->add_val == const0_rtx)
  3995.         *add_val = g->add_val;
  3996.       else
  3997.         return 0;
  3998.  
  3999.       if (subexp)
  4000.         {
  4001.           /* G deleted when return, can't return pointer to it */
  4002.           if (*forces2 == 0)
  4003.         *forces2 = v;
  4004.           return ADD_BENEFIT + g->benefit;
  4005.         }
  4006.       else
  4007.         {
  4008.           *forces = g;
  4009.           *forces2 = v;
  4010.           return ADD_BENEFIT;
  4011.         }
  4012.     }
  4013.       else if (v)
  4014.     {
  4015.       if (GET_CODE (v->mult_val) != CONST_INT)
  4016.         return 0;
  4017.       if (arg == XEXP (x, 0))             /* giv1 = giv2 - biv */
  4018.         {
  4019.           *mult_val = gen_rtx (CONST_INT, VOIDmode,
  4020.                      INTVAL (v->mult_val) - 1);
  4021.           *add_val = v->add_val;
  4022.         }
  4023.       else                                /* giv1 = biv - giv2 */
  4024.         {
  4025.           *mult_val = gen_rtx (CONST_INT, VOIDmode,
  4026.                      1 - INTVAL (v->mult_val));
  4027.           if (GET_CODE (v->add_val) == CONST_INT)
  4028.         *add_val = gen_rtx (CONST_INT, VOIDmode,
  4029.                       - INTVAL (v->add_val));
  4030.           else
  4031.         return 0;
  4032.         }
  4033.       *forces = v;
  4034.       return ADD_BENEFIT;
  4035.     }
  4036.       else if (g)
  4037.     {
  4038.       if (arg == XEXP (x, 1))
  4039.         *mult_val = g->mult_val;
  4040.       else
  4041.         {
  4042.           if (GET_CODE (g->mult_val) == CONST_INT)
  4043.         *mult_val = gen_rtx (CONST_INT, VOIDmode,
  4044.                        - INTVAL (g->mult_val));
  4045.           else
  4046.         return 0;
  4047.         }
  4048.       if (GET_CODE (g->add_val) == CONST_INT)
  4049.         {
  4050.           if (g->add_val == const0_rtx)
  4051.         {
  4052.           if (arg == XEXP (x, 1))    /* giv1 = giv2 - arg */
  4053.             {
  4054.               /* Fail unless arg is a constant.  */
  4055.               if (GET_CODE (arg) == CONST_INT)
  4056.             *add_val = gen_rtx (CONST_INT, VOIDmode,
  4057.                           -INTVAL (arg));
  4058.               else
  4059.             return 0;
  4060.             }
  4061.           else                       /* giv1 = arg - giv2 */
  4062.             *add_val = arg;
  4063.         }
  4064.           else if (GET_CODE (arg) == CONST_INT)
  4065.         {
  4066.           if (arg == XEXP (x, 1))   /* giv1 = giv2 - arg */
  4067.             *add_val = gen_rtx (CONST_INT, VOIDmode,
  4068.                       INTVAL (g->add_val)
  4069.                       - INTVAL (arg));
  4070.           else                      /* giv1 = arg - giv2 */
  4071.             *add_val = gen_rtx (CONST_INT, VOIDmode,
  4072.                       INTVAL (arg),
  4073.                       - INTVAL (g->add_val));
  4074.         }
  4075.           else
  4076.         return 0;
  4077.         }
  4078.       else
  4079.         /* Could succeed if arg == 0, but that will never occur.  */
  4080.         return 0;
  4081.  
  4082.       if (subexp)
  4083.         /* G deleted when return, can't return pointer to it.  */
  4084.         return ADD_BENEFIT + g->benefit;
  4085.       else
  4086.         {
  4087.           *forces = g;
  4088.           return ADD_BENEFIT;
  4089.         }
  4090.     }
  4091.       else if (GET_CODE (arg) == CONST_INT)
  4092.     {
  4093.       if (arg == XEXP (x, 1))
  4094.         {
  4095.           *add_val = gen_rtx (CONST_INT, VOIDmode, - INTVAL (arg));
  4096.           *mult_val = const1_rtx;
  4097.         }
  4098.       else
  4099.         {
  4100.           *add_val = arg;
  4101.           *mult_val = gen_rtx (CONST_INT, VOIDmode, -1);
  4102.         }
  4103.       return ADD_BENEFIT;
  4104.     }
  4105.       else
  4106.       return 0;
  4107.  
  4108.       /* UMULT can be handled like MULT since C ignores overflows.  */
  4109.     case MULT:
  4110.     case UMULT:
  4111.       if (v && g)
  4112.     {
  4113.       /* Quadratic term, just fail.  */
  4114.       return 0;
  4115.     }
  4116.       else if (v)
  4117.     {
  4118.       /* Quadratic term, just fail.  */
  4119.       return 0;
  4120.     }
  4121.       else if (g)
  4122.     {
  4123.       /* Takes a lot of code and will rarely succeed.  */
  4124.       /* dest = m * arg * b + a * arg */
  4125.       if (GET_CODE (g->mult_val) == CONST_INT)
  4126.         {
  4127.           if (g->mult_val == const0_rtx)
  4128.         *mult_val = const0_rtx;
  4129.           else if (g->mult_val == const1_rtx)
  4130.         *mult_val = arg;
  4131.           else if (GET_CODE (arg) == CONST_INT)
  4132.         *mult_val = gen_rtx (CONST_INT, VOIDmode,
  4133.                        INTVAL (g->mult_val) * INTVAL (arg));
  4134.           else
  4135.         return 0;
  4136.         }
  4137.       else
  4138.         /* Could suceed if arg == 1 or 0, but this will never occur.  */
  4139.         return 0;
  4140.  
  4141.       if (GET_CODE (g->add_val) == CONST_INT)
  4142.         {
  4143.           if (g->add_val == const0_rtx)
  4144.         *add_val = const0_rtx;
  4145.           else if (g->add_val == const1_rtx)
  4146.         *add_val = arg;
  4147.           else if (GET_CODE (arg) == CONST_INT)
  4148.         *add_val = gen_rtx (CONST_INT, VOIDmode,
  4149.                        INTVAL (g->add_val) * INTVAL (arg));
  4150.           else
  4151.         return 0;
  4152.         }
  4153.       else
  4154.         /* Could suceed if arg == 1 or 0, but this will never occur.  */
  4155.         return 0;
  4156.  
  4157.       if (subexp)
  4158.         /* G deleted when return, can't return pointer to it.  */
  4159.         return MULT_BENEFIT + g->benefit;
  4160.       else
  4161.         {
  4162.           *forces = g;
  4163.           return MULT_BENEFIT;
  4164.         }
  4165.     }
  4166.       else
  4167.     {
  4168.       *mult_val = arg;
  4169.       *add_val = const0_rtx;
  4170.       return MULT_BENEFIT;
  4171.     }
  4172.  
  4173.       /* These are not worth the trouble.  */
  4174.     case DIV:
  4175.     case UDIV:
  4176.       return 0;
  4177.  
  4178.       /* Handle these, but only for left shift.  */
  4179.     case LSHIFT:
  4180.     case ASHIFT:
  4181.       if (v && g)
  4182.     {
  4183.       /* Quadratic term, just fail.  */
  4184.       return 0;
  4185.     }
  4186.       else if (v)
  4187.     {
  4188.       /* Quadratic term, just fail.  */
  4189.       return 0;
  4190.     }
  4191.       else if (g)
  4192.     {
  4193.       /* Takes a lot of code and will rarely succeed.  */
  4194.       /* dest = ((m * b) << arg) + (a << arg) */
  4195.       if (GET_CODE (g->mult_val) == CONST_INT)
  4196.         {
  4197.           if (g->mult_val == const0_rtx)
  4198.         *mult_val = const0_rtx;
  4199.           else if (GET_CODE (arg) == CONST_INT && INTVAL (arg) >= 0)
  4200.         *mult_val = gen_rtx (CONST_INT, VOIDmode,
  4201.                        INTVAL (g->mult_val)
  4202.                        * (1 << INTVAL (arg)));
  4203.           else
  4204.         return 0;
  4205.         }
  4206.       else
  4207.         /* Could suceed if arg == 0, but this will never occur.  */
  4208.         return 0;
  4209.  
  4210.       if (GET_CODE (g->add_val) == CONST_INT)
  4211.         {
  4212.           if (g->add_val == const0_rtx)
  4213.         *add_val = const0_rtx;
  4214.           else if (GET_CODE (arg) == CONST_INT)
  4215.         *add_val = gen_rtx (CONST_INT, VOIDmode,
  4216.                        INTVAL (g->add_val)
  4217.                        * (1 << INTVAL (arg)));
  4218.           else
  4219.         return 0;
  4220.         }
  4221.       else
  4222.         /* Could suceed if arg == 0, but this will never occur.  */
  4223.         return 0;
  4224.  
  4225.       if (subexp)
  4226.         /* G deleted when return, can't return pointer to it.  */
  4227.         return SHIFT_BENEFIT + g->benefit;
  4228.       else
  4229.         {
  4230.           *forces = g;
  4231.           return SHIFT_BENEFIT;
  4232.         }
  4233.     }
  4234.  
  4235.       if (GET_CODE (arg) == CONST_INT && INTVAL (arg) >= 0)
  4236.     *mult_val = gen_rtx (CONST_INT, VOIDmode, 1 << INTVAL (arg));
  4237.       else
  4238.     return 0;
  4239.       *add_val = const0_rtx;
  4240.       return SHIFT_BENEFIT;
  4241.  
  4242.       /* These are not worth the trouble.  */
  4243.     case ASHIFTRT:
  4244.     case LSHIFTRT:
  4245.       return 0;
  4246.  
  4247.       /* should never reach here */
  4248.     default:
  4249.       abort ();
  4250.       return 0;
  4251.     }
  4252. }
  4253.  
  4254. /* Help detect a giv that is calculated by several consecutive insns;
  4255.    for example,
  4256.       giv = biv * M
  4257.       giv = giv + A
  4258.    The caller has already identified the first insn P as having a giv as dest;
  4259.    we check that all other insns that set the same register follow
  4260.    immediately after P, that they alter nothing else,
  4261.    and that the result of the last is still a giv.
  4262.  
  4263.    The value is 0 if the reg set in P is not really a giv.
  4264.    Otherwise, the value is the amount gained by eliminating
  4265.    all the consecutive insns that compute the value.
  4266.  
  4267.    FIRST_BENEFIT is the amount gained by eliminating the first insn, P.
  4268.    SRC_REGNO is the regno of the biv; DEST_REGNO is that of the giv.
  4269.  
  4270.    The coefficients of the ultimate giv value are stored in
  4271.    *MULT_VAL and *ADD_VAL.  */
  4272.  
  4273. static int
  4274. consec_sets_giv (first_benefit, p, src_regno, dest_regno,
  4275.          add_val, mult_val)
  4276.      int first_benefit;
  4277.      rtx p;
  4278.      int src_regno;
  4279.      int dest_regno;
  4280.      rtx *add_val;
  4281.      rtx *mult_val;
  4282. {
  4283.   int count;
  4284.   int benefit = first_benefit;
  4285.   enum rtx_code code;
  4286.   struct induction forces, forces2;
  4287.   rtx temp;
  4288.   int tem;
  4289.  
  4290.   /* Initialize info used by general_induction_var.  */
  4291.   struct induction *v =
  4292.     (struct induction *) oballoc (sizeof (struct induction));
  4293.   v->src_regno = src_regno;
  4294.   v->mult_val = *mult_val;
  4295.   v->add_val = *add_val;
  4296.  
  4297.   induct_var[dest_regno] = GENERAL_INDUCT;
  4298.   induct_struct[dest_regno] = v;
  4299.  
  4300.   count = n_times_set[dest_regno] - 1;
  4301.  
  4302.   while (count > 0)
  4303.     {
  4304.       p = NEXT_INSN (p);
  4305.       code = GET_CODE (p);
  4306.  
  4307.       /* If libcall, skip to end of call sequence.  */
  4308.       if (code == INSN && (temp = find_reg_note (p, REG_LIBCALL, 0)))
  4309.     p = XEXP (temp, 0);
  4310.  
  4311.       if (code == INSN && GET_CODE (PATTERN (p)) == SET
  4312.       && GET_CODE (SET_DEST (PATTERN (p))) == REG
  4313.       && REGNO (SET_DEST (PATTERN (p))) == dest_regno
  4314.       && ((tem = general_induction_var (SET_SRC (PATTERN (p)), &src_regno,
  4315.                         add_val, mult_val,
  4316.                         &forces, &forces2))
  4317.           /* Giv created by call to library routine.  */
  4318.           || ((temp = find_reg_note (p, REG_EQUAL, 0)) &&
  4319.           (tem = general_induction_var (XEXP (temp, 0), &src_regno,
  4320.                         add_val, mult_val,
  4321.                         &forces, &forces2))))
  4322.       && src_regno == v->src_regno)
  4323.     {
  4324.       count--;
  4325.       benefit += tem;
  4326.       v->mult_val = *mult_val;
  4327.       v->add_val = *add_val;
  4328.     }
  4329.       else if (code != NOTE)
  4330.     {
  4331.       induct_var[dest_regno] = UNKNOWN_INDUCT;
  4332.       return 0;
  4333.     }
  4334.     }
  4335.  
  4336.   return benefit;
  4337. }
  4338.  
  4339. /* Generate a SEQUENCE to multiply OP0 and OP1 with result in TARGET.
  4340.    Use expand_mult to "optimally" do the multiply.
  4341.    This also works for machines that do not have multiply insns.
  4342.    If one of the operands is a constant, it must be the second.  */
  4343.  
  4344. static rtx
  4345. gen_iv_mult (mode, op0, op1, target)
  4346.      enum machine_mode mode;
  4347.      register rtx op0, op1, target;
  4348. {
  4349.   extern rtx gen_sequence ();
  4350.   extern rtx start_sequence ();
  4351.   rtx saved, result, temp;
  4352.  
  4353.   saved = start_sequence ();
  4354.  
  4355.   /* ??? It is very unmodular to use expand_mult here!
  4356.      This should be redesigned.  */
  4357.  
  4358.   /* UNSIGNEDP arg can be zero since operands/target always same width.  */
  4359.   temp = expand_mult (mode, op0, op1, target, 0);
  4360.  
  4361.   /* Move to target register, if expand_mult did not put it there.  */
  4362.   if (target != 0 && temp != target)
  4363.     emit_move_insn (target, temp);
  4364.  
  4365.   result = gen_sequence ();
  4366.   end_sequence (saved);
  4367.  
  4368.   return result;
  4369. }
  4370.  
  4371. /* Emit code to initialize an induction variable created by strength
  4372.    reduction.
  4373.    More precisely, emit code before INSERT_BEFORE
  4374.    to set REG = B * M + A.  */
  4375.  
  4376. static void
  4377. emit_iv_init_code (b, m, a, reg, insert_before)
  4378.      rtx b;          /* initial value of basic induction variable */
  4379.      rtx m;          /* multiplicative constant */
  4380.      rtx a;          /* additive constant */
  4381.      rtx reg;        /* destination register */
  4382.      rtx insert_before;
  4383. {
  4384.   rtx seq;
  4385.   rtx result;
  4386.  
  4387.   /* Prevent unexpected sharing of these rtx.  */
  4388.   a = copy_rtx (a);
  4389.   b = copy_rtx (b);
  4390.  
  4391.   start_sequence ();
  4392.   result = expand_mult_add (b, m, a, GET_MODE (reg), 0);
  4393.   if (reg != result)
  4394.     emit_move_insn (reg, result);
  4395.   seq = gen_sequence ();
  4396.   end_sequence ();
  4397.  
  4398.   emit_insn_before (seq, insert_before);
  4399. }
  4400.  
  4401. /* Emit code to increment the induction variable inside the loop.
  4402.    Try to emit optimal code for the expression
  4403.    REG = REG + BIV_ADD * GIV_MULT.  */
  4404.  
  4405. static void
  4406. emit_iv_inc (biv_add, giv_mult, reg, insn)
  4407.      rtx biv_add;                   /* increment value for biv */
  4408.      rtx giv_mult;                  /* multiply value of giv */
  4409.      rtx reg;                       /* create insn to set this reg */
  4410.      rtx insn;                      /* where to insert the new insn */
  4411. {
  4412.   emit_iv_init_code (biv_add, giv_mult, reg, reg, insn);
  4413. }
  4414.  
  4415. /* Test whethen BIV_ADD * GIV_MULT can be computed without
  4416.    an actual multiply insn.  Value is 1 if so.  */
  4417.  
  4418. static int
  4419. product_cheap_p (biv_add, giv_mult)
  4420.      rtx biv_add;
  4421.      rtx giv_mult;
  4422. {
  4423.   /* Indicates which of MULT/ADD are constants.  */
  4424.   int status = 0;
  4425.   int const_val;
  4426.   rtx tmp;
  4427.  
  4428.   if (GET_CODE (biv_add) == CONST_INT)
  4429.     status |= 0x1;
  4430.   if (GET_CODE (giv_mult) == CONST_INT)
  4431.     status |= 0x2;
  4432.  
  4433.   switch (status)
  4434.     {
  4435.     case 0:
  4436.       /* Neither is constant: would need a multiply insn, so fail.  */
  4437.       return 0;
  4438.  
  4439.     case 1:
  4440.       /* BIV_ADD value is constant */
  4441.       /* Equivalent to state 2, just switch values of BIV_ADD and GIV_MULT
  4442.      and fall through.  */
  4443.       tmp = biv_add;
  4444.       biv_add = giv_mult;
  4445.       giv_mult = tmp;
  4446.  
  4447.     case 2:
  4448.       /* GIV_MULT value is constant.
  4449.      If it is 1, 0 or -1 then we win.  */
  4450.       const_val = INTVAL (giv_mult);
  4451.       if (const_val < -1 || const_val > 1)
  4452.     {
  4453.       tmp = gen_iv_mult (GET_MODE (biv_add), biv_add, giv_mult, 0);
  4454.       /* Don't emit a multiply insn, just fail instead.  */
  4455.       if ((GET_CODE (tmp) == SET && GET_CODE (SET_SRC (tmp)) == MULT)
  4456.              /* Also fail if library call (which generates more
  4457.             then two insn) is needed.  */
  4458.           || (GET_CODE (tmp) == SEQUENCE && XVECLEN (tmp, 0) > 2))
  4459.         return 0;
  4460.     }
  4461.       return 1;
  4462.  
  4463.     case 3:
  4464.       /* Both BIV_ADD and GIV_MULT are constant;
  4465.      can compute the product at compile time.  */
  4466.       return 1;
  4467.  
  4468.     default:
  4469.       abort ();
  4470.     }
  4471. }
  4472.  
  4473.  
  4474. /* Check to see if loop can be terminated by a "decrement and branch until
  4475.    zero" instruction.  If so, add a REG_NONNEG note to the branch insn if so.
  4476.    Also try reversing an increment loop to a decrement loop
  4477.    to see if the optimization can be performed.
  4478.    Value is nonzero if optimization was performed.  */
  4479.  
  4480. static int
  4481. check_dbra_loop (loop_end, iv_list, insn_count, loop_start)
  4482.      rtx loop_end;
  4483.      struct iv_class *iv_list;
  4484.      int insn_count;
  4485.      rtx loop_start;
  4486. {
  4487.   struct iv_class *bl;
  4488.   rtx reg;
  4489.   rtx jump_label;
  4490.   rtx final_value;
  4491.   rtx start_value;
  4492.   enum rtx_code branch_code;
  4493.   rtx new_add_val;
  4494.   rtx tested_before_loop = 0;
  4495.   rtx p;
  4496.  
  4497.   /* See if the loop is contained in  `if (X >= 0)' for some reg X.
  4498.      If so, then we know X is initially nonnegative even though
  4499.      we don't know its initial value.
  4500.      Record X in TESTED_BEFORE_LOOP.  */
  4501.  
  4502.   for (p = loop_start; p != 0; p = PREV_INSN (p))
  4503.     if (GET_CODE (p) != NOTE)
  4504.       break;
  4505.  
  4506.   /* See if a conditional branch preceeds the loop.
  4507.      There may be no other insns or labels between it and
  4508.      the beginning of the loop.  */
  4509.   if (p != 0 && GET_CODE (p) == JUMP_INSN && condjump_p (p)
  4510.       && SET_SRC (PATTERN (p)) != pc_rtx
  4511.       && ((GET_CODE (XEXP (SET_SRC (PATTERN (p)), 0)) == LT
  4512.        && XEXP (SET_SRC (PATTERN (p)), 2) == pc_rtx)
  4513.       ||
  4514.       (GET_CODE (XEXP (SET_SRC (PATTERN (p)), 0)) == GE
  4515.        && XEXP (SET_SRC (PATTERN (p)), 1) == pc_rtx))
  4516.       && next_real_insn (JUMP_LABEL (p)) == next_real_insn (loop_end))
  4517.     {
  4518.       /* Before the branch should be a test or compare.
  4519.      See if we are comparing something against zero.  */
  4520.       p = PREV_INSN (p);
  4521.       if (GET_CODE (p) == INSN && GET_CODE (PATTERN (p)) == SET
  4522.       && SET_DEST (PATTERN (p)) == cc0_rtx)
  4523.     {
  4524.       if (GET_CODE (SET_SRC (PATTERN (p))) == REG)
  4525.         tested_before_loop = SET_SRC (PATTERN (p));
  4526.       else if (GET_CODE (SET_SRC (PATTERN (p))) == COMPARE
  4527.            && GET_CODE (XEXP (SET_SRC (PATTERN (p)), 0)) == REG
  4528.            && XEXP (SET_SRC (PATTERN (p)), 1) == const0_rtx)
  4529.         tested_before_loop = XEXP (SET_SRC (PATTERN (p)), 0);
  4530.       else if (GET_CODE (SET_SRC (PATTERN (p))) == COMPARE
  4531.            && GET_CODE (XEXP (SET_SRC (PATTERN (p)), 1)) == REG
  4532.            && XEXP (SET_SRC (PATTERN (p)), 0) == const0_rtx)
  4533.         tested_before_loop = XEXP (SET_SRC (PATTERN (p)), 1);
  4534.     }
  4535.     }
  4536.  
  4537.   /* If last insn is a conditional branch, and the insn before tests a register
  4538.      value, then try to optimize it.  */
  4539.  
  4540.   if (GET_CODE (PREV_INSN (loop_end)) == JUMP_INSN
  4541.       && GET_CODE (PATTERN (PREV_INSN (loop_end))) == SET
  4542.       && GET_CODE (SET_SRC (PATTERN (PREV_INSN (loop_end)))) == IF_THEN_ELSE
  4543.       && GET_CODE (PREV_INSN (PREV_INSN (loop_end))) == INSN
  4544.       && GET_CODE (PATTERN (PREV_INSN (PREV_INSN (loop_end)))) == SET
  4545.       && (GET_CODE (SET_DEST (PATTERN (PREV_INSN (PREV_INSN (loop_end))))) ==
  4546.       CC0))
  4547.     {
  4548.       /* Check all of the bivs to see if the compare uses one of them.  */
  4549.  
  4550.       for (bl = iv_list; bl; bl = bl->next)
  4551.     {
  4552.       if (reg_mentioned_p (SET_DEST (PATTERN (bl->biv->insn)),
  4553.                    PREV_INSN (PREV_INSN (loop_end))))
  4554.         break;
  4555.     }
  4556.  
  4557.       /* If biv set more than once, then give up.
  4558.      We can't guarantee that it will be zero on the last iteration.
  4559.      Also give up if the biv is used between its update and the test
  4560.      insn.  */
  4561.       if (bl && bl->biv_count == 1
  4562.       && ! reg_used_between_p (regno_reg_rtx[bl->regno], bl->biv->insn,
  4563.                    PREV_INSN (PREV_INSN (loop_end))))
  4564.     {
  4565.       /* Look for the case where the basic induction variable is always
  4566.          nonnegative, and equals zero on the last iteration.
  4567.          In this case, add a reg_note REG_NONNEG, which allows the
  4568.          m68k DBRA instruction to be used.  */
  4569.  
  4570.       /* the decrement case */
  4571.  
  4572.       if (GET_CODE (bl->biv->add_val) == CONST_INT
  4573.           && INTVAL (bl->biv->add_val) < 0)
  4574.         {
  4575.           /* Initial value must be greater than 0,
  4576.          init_val % -dec_value == 0 to ensure that it equals zero on
  4577.             the last iteration */
  4578.  
  4579.           if (GET_CODE (bl->initial_value) == CONST_INT
  4580.           && INTVAL (bl->initial_value) > 0
  4581.           && (INTVAL (bl->initial_value) %
  4582.               (-INTVAL (bl->biv->add_val))) == 0)
  4583.         {
  4584.           /* register always nonnegative, add REG_NOTE to branch */
  4585.           REG_NOTES (PREV_INSN (loop_end))
  4586.             = gen_rtx (EXPR_LIST, REG_NONNEG, 0,
  4587.                    REG_NOTES (PREV_INSN (loop_end)));
  4588.           bl->nonneg = 1;
  4589.  
  4590.           return 1;
  4591.         }
  4592.  
  4593.           /* If the decrement is 1 and the value was tested as >= 0 before
  4594.          the loop, then we can safely optimize.  */
  4595.           if (SET_DEST (PATTERN (bl->biv->insn)) == tested_before_loop
  4596.           && INTVAL (bl->biv->add_val) == -1)
  4597.         {
  4598.           REG_NOTES (PREV_INSN (loop_end))
  4599.             = gen_rtx (EXPR_LIST, REG_NONNEG, 0,
  4600.                    REG_NOTES (PREV_INSN (loop_end)));
  4601.           bl->nonneg = 1;
  4602.  
  4603.           return 1;
  4604.         }
  4605.         }
  4606.       else if (num_mem_sets <= 1)
  4607.         {
  4608.           /* Try to change inc to dec, so can apply above optimization.  */
  4609.           /* Can do this if:
  4610.          all registers modified are induction variables or invariant,
  4611.          all memory references have non-overlapping addresses
  4612.                        (obviously true if only one write)
  4613.              allow 2 insns for the compare/jump at the end of the loop.  */
  4614.           int num_nonfixed_reads = 0;
  4615.           rtx p;
  4616.  
  4617.           for (p = loop_start; p != loop_end; p = NEXT_INSN (p))
  4618.         if (GET_CODE (p) == INSN || GET_CODE (p) == CALL_INSN
  4619.             || GET_CODE (p) == JUMP_INSN)
  4620.           num_nonfixed_reads += count_nonfixed_reads (PATTERN (p));
  4621.  
  4622.           /* This code only acts for innermost loops.  Also it simplifies
  4623.          the memory address check by only reversing loops with
  4624.          zero or one memory access.
  4625.          Two memory accesses could involve parts of the same array,
  4626.          and that can't be reversed.  */
  4627.  
  4628.           if (num_nonfixed_reads <= 1
  4629.           && !loop_has_call
  4630.           && (bl->giv_count + bl->biv_count + num_mem_sets
  4631.               + num_movables + 2 == insn_count))
  4632.         {
  4633.           rtx src_two_before_end;
  4634.           int constant;
  4635.           int win;
  4636.  
  4637.           /* Loop can be reversed.  */
  4638.           if (loop_dump_stream)
  4639.             fprintf (loop_dump_stream, "Can reverse loop\n");
  4640.  
  4641.           /* Now check other conditions:
  4642.              initial_value must be zero,
  4643.              final_value % add_val == 0, so that when reversed, the
  4644.              biv will be zero on the last iteration.  */
  4645.  
  4646.           /* Calculating the final value non trivial.
  4647.              If branch is (LT (CC0) (CONST 0),
  4648.              then value in compare is final value.
  4649.              If branch is (LE (CC0) (CONST 0),
  4650.              then value in compare is final_value - add_val */
  4651.  
  4652.           branch_code
  4653.             = GET_CODE (XEXP (SET_SRC (PATTERN (PREV_INSN (loop_end))), 0));
  4654.           src_two_before_end
  4655.             = SET_SRC (PATTERN (PREV_INSN (PREV_INSN (loop_end))));
  4656.  
  4657.           win = 1;
  4658.           if (GET_CODE (src_two_before_end) == REG)
  4659.             constant = 0;
  4660.           else if (GET_CODE (src_two_before_end) == COMPARE
  4661.                && GET_CODE (XEXP (src_two_before_end, 1)) == CONST_INT)
  4662.             constant = INTVAL (XEXP (src_two_before_end, 1));
  4663.           else
  4664.             win = 0;
  4665.  
  4666.           if (win && bl->initial_value == const0_rtx
  4667.               && (branch_code == LT || branch_code == LE)
  4668.               && XEXP (XEXP (SET_SRC (PATTERN (PREV_INSN (loop_end))), 0), 1) == const0_rtx
  4669.               && (constant % INTVAL (bl->biv->add_val)) == 0)
  4670.             {
  4671.               /* Register will always be nonnegative, with value
  4672.              0 on last iteration if loop reversed */
  4673.  
  4674.               /* Save some info needed to produce the new insns.  */
  4675.               reg = SET_DEST (PATTERN (bl->biv->insn));
  4676.               jump_label = XEXP (SET_SRC (PATTERN (PREV_INSN (loop_end))), 1);
  4677.               new_add_val = gen_rtx (CONST_INT, VOIDmode,
  4678.                          - INTVAL (bl->biv->add_val));
  4679.  
  4680.  
  4681.               if (branch_code == LT)
  4682.             {
  4683.               final_value
  4684.                 = gen_rtx (CONST_INT, VOIDmode, constant);
  4685.               start_value
  4686.                 = gen_rtx (CONST_INT, VOIDmode,
  4687.                        (constant - INTVAL (bl->biv->add_val)));
  4688.             }
  4689.               else /* branch_code == LE */
  4690.             {
  4691.               start_value
  4692.                 = gen_rtx (CONST_INT, VOIDmode, constant);
  4693.               final_value
  4694.                 = gen_rtx (CONST_INT, VOIDmode,
  4695.                        (constant + INTVAL (bl->biv->add_val)));
  4696.             }
  4697.  
  4698.               /* Initialize biv to start_value before loop start.
  4699.              The old initializing insn will be deleted as a
  4700.              dead store by flow.c.  */
  4701.               emit_insn_before (gen_rtx (SET, VOIDmode, reg,
  4702.                          start_value),
  4703.                     loop_start);
  4704.  
  4705.               /* Add insn to decrement register, and delete insn
  4706.              that incremented the register.  */
  4707.               emit_insn_before (gen_rtx (SET, VOIDmode, reg,
  4708.                       gen_rtx (PLUS, GET_MODE (reg), reg,
  4709.                            new_add_val)),
  4710.                     bl->biv->insn);
  4711.               /* Update biv info to reflect its new status.  */
  4712.               bl->biv->insn = PREV_INSN (bl->biv->insn);
  4713.               delete_insn (NEXT_INSN (bl->biv->insn));
  4714.  
  4715.               /* Inc LABEL_NUSES so that delete_insn will
  4716.              not delete the label.  */
  4717.               LABEL_NUSES (XEXP (jump_label, 0)) ++;
  4718.  
  4719.               if (regno_last_uid[bl->regno] != INSN_UID (PREV_INSN (loop_end)))
  4720.             emit_insn_after (gen_rtx (SET, VOIDmode, reg,
  4721.                           final_value),
  4722.                      loop_end);
  4723.  
  4724.               /* Delete compare/branch at end of loop.  */
  4725.               delete_insn (PREV_INSN (loop_end));
  4726.               delete_insn (PREV_INSN (loop_end));
  4727.  
  4728.               /* Add new compare/branch insn at end of loop.  */
  4729.               emit_insn_before (gen_rtx (SET, VOIDmode, cc0_rtx, reg),
  4730.                     loop_end);
  4731.               emit_jump_insn_before (gen_rtx (SET, VOIDmode, pc_rtx,
  4732.                      gen_rtx (IF_THEN_ELSE, VOIDmode,
  4733.                          gen_rtx (GE, VOIDmode, cc0_rtx,
  4734.                               const0_rtx),
  4735.                          jump_label,
  4736.                          pc_rtx)),
  4737.                       loop_end);
  4738.  
  4739.               JUMP_LABEL (PREV_INSN (loop_end)) = XEXP (jump_label, 0);
  4740.               /* Increment of LABEL_NUSES done above. */
  4741.  
  4742.               /* Register is now always nonnegative,
  4743.              so add REG_NONNEG note to the branch.  */
  4744.               REG_NOTES (PREV_INSN (loop_end))
  4745.             = gen_rtx (EXPR_LIST, REG_NONNEG, 0,
  4746.                    REG_NOTES (PREV_INSN (loop_end)));
  4747.               bl->nonneg = 1;
  4748.  
  4749.               /* Update rest of biv info.  */
  4750.               bl->initial_value = start_value;
  4751.               bl->biv->add_val = new_add_val;
  4752.  
  4753.               if (loop_dump_stream)
  4754.             fprintf (loop_dump_stream, "Reversed loop and added reg_nonneg\n");
  4755.  
  4756.               return 1;
  4757.             }
  4758.         }
  4759.         }
  4760.     }
  4761.     }
  4762.   return 0;
  4763. }
  4764.  
  4765. /* Verify whether the biv BL appears to be eliminable,
  4766.    based on the insns in the loop that refer to it.
  4767.    LOOP_START is the first insn of the loop, and END is the end insn.  */
  4768.  
  4769. static void
  4770. check_eliminate_biv (bl, loop_start, end)
  4771.      struct iv_class *bl;
  4772.      rtx loop_start;
  4773.      rtx end;
  4774. {
  4775.   /* Get the REG rtx for the biv.  */
  4776.   rtx reg = SET_DEST (PATTERN (bl->biv->insn));
  4777.   rtx p;
  4778.   struct induction *v;
  4779.  
  4780.   bl->eliminable = 0;
  4781.  
  4782.   for (p = loop_start; p != end; p = NEXT_INSN (p))
  4783.     {
  4784.       enum rtx_code code = GET_CODE (p);
  4785.       if ((code == INSN || code == JUMP_INSN || code == CALL_INSN)
  4786.       && reg_mentioned_p (reg, PATTERN (p)))
  4787.     {
  4788.       /* This insn uses the biv.  If we can't understand it,
  4789.          then we can't eliminate the biv.  */
  4790.       if (GET_CODE (PATTERN (p)) != SET)
  4791.         {
  4792.           if (loop_dump_stream)
  4793.         fprintf (loop_dump_stream,
  4794.              "Cannot eliminate biv %d: cannot understand insn %d.\n",
  4795.              bl->regno, INSN_UID (p));
  4796.           break;
  4797.         }
  4798.  
  4799.       /* The insns that increment the biv are no problem.  */
  4800.       if (SET_DEST (PATTERN (p)) == reg)
  4801.         continue;
  4802.  
  4803.       /* If this is an insn which uses the biv ONLY in the
  4804.          calculation of a giv which is in the family of this
  4805.          biv, it's ok becuase it will go away when the giv is
  4806.          reduced.  March 14, 1989 -- self@bayes.arc.nasa.gov */
  4807.       for (v = bl->giv; v; v = v->family)
  4808.         if (v->insn == p)
  4809.           {
  4810.         if (v->giv_type == DEST_REG
  4811.             || (v->giv_type == DEST_ADDR
  4812.             /* Test was backwards - rms, 5 Dec 89 */
  4813.             && only_reg_use_p (reg, *(v->location),
  4814.                        PATTERN (p))))
  4815.           break;
  4816.           }
  4817.       if (v)
  4818.         continue;
  4819.  
  4820.       /* If can rewrite this insn not to use the biv, it's ok.  */
  4821.       if (can_eliminate_biv_p (p, bl))
  4822.         continue;
  4823.  
  4824.       /* Biv is used in a way we cannot eliminate.  */
  4825.       if (loop_dump_stream)
  4826.         fprintf (loop_dump_stream,
  4827.              "Cannot eliminate biv %d: biv used in insn %d.\n",
  4828.              bl->regno, INSN_UID (p));
  4829.       break;
  4830.     }
  4831.     }
  4832.  
  4833.   if (p == end)
  4834.     {
  4835.       bl->eliminable = 1;
  4836.       if (loop_dump_stream)
  4837.     fprintf (loop_dump_stream, "Can eliminate biv %d.\n",
  4838.          bl->regno);
  4839.     }
  4840. }
  4841.  
  4842. /* Return 1 if INSN, a compare insn which tests the biv described by BL,
  4843.    can be rewritten to use instead some reduced giv related to that biv.
  4844.    Does not change the rtl.
  4845.  
  4846.    We make the assumption that all the givs depending on this biv
  4847.    will be reduced, since only in that case will an attempt to eliminate
  4848.    the biv actually be made.
  4849.  
  4850.    The following function is very parallel to this one.  */
  4851.  
  4852. static int
  4853. can_eliminate_biv_p (insn, bl)
  4854.      rtx insn;
  4855.      struct iv_class *bl;
  4856. {
  4857.   rtx src;
  4858.   enum rtx_code code;
  4859.   struct induction *v, *tv;
  4860.   rtx arg;
  4861.   int arg_operand;
  4862.   /* Mode of this biv.  */
  4863.   enum machine_mode mode = bl->biv->mode;
  4864.  
  4865.   if (SET_DEST (PATTERN (insn)) != cc0_rtx)
  4866.     return 0;
  4867.  
  4868.   src = SET_SRC (PATTERN (insn));
  4869.   code = GET_CODE (src);
  4870.  
  4871.   switch (code)
  4872.     {
  4873.       /* a test insn */
  4874.     case REG:
  4875.       /* Can replace with any giv that has (MULT_VAL != 0) and (ADD_VAL == 0)
  4876.      Require a constant integer for MULT_VAL, so we know it's nonzero.  */
  4877.  
  4878.       for (v = bl->giv; v; v = v->family)
  4879.     if (GET_CODE (v->mult_val) == CONST_INT && v->mult_val != const0_rtx
  4880.         && v->add_val == const0_rtx
  4881.         && ! v->ignore
  4882.         && v->mode == mode)
  4883.       return 1;
  4884.  
  4885.       /* Look for a giv with (MULT_VAL != 0) and (ADD_VAL != 0)
  4886.      where ADD_VAL is a constant or a register;
  4887.      can replace test insn with a compare insn (cmp REDUCED_GIV ADD_VAL).
  4888.      Require a constant integer for MULT_VAL, so we know it's nonzero.  */
  4889.  
  4890.       for (v = bl->giv; v; v = v->family)
  4891.     if (GET_CODE (v->mult_val) == CONST_INT && v->mult_val != const0_rtx
  4892.         && (GET_CODE (v->add_val) == REG || GET_CODE (v->add_val) == CONST_INT)
  4893.         && ! v->ignore
  4894.         && v->mode == mode)
  4895.       return 1;
  4896.  
  4897.       if (loop_dump_stream)
  4898.     fprintf (loop_dump_stream, "Cannot eliminate biv %d in test insn %d: no appropriate giv.\n",
  4899.          bl->regno, INSN_UID (insn));
  4900.  
  4901.       return 0;
  4902.  
  4903.       /* a compare insn */
  4904.     case COMPARE:
  4905.       /* Figure out which operand is the biv.  */
  4906.       if ((GET_CODE (XEXP (src, 0)) == REG)
  4907.       && (REGNO (XEXP (src, 0)) == bl->regno))
  4908.     {
  4909.       arg = XEXP (src, 1);
  4910.       arg_operand = 1;
  4911.     }
  4912.       else if ((GET_CODE (XEXP (src, 1)) == REG)
  4913.            && (REGNO (XEXP (src, 1)) == bl->regno))
  4914.     {
  4915.       arg = XEXP (src, 0);
  4916.       arg_operand = 0;
  4917.     }
  4918.       else
  4919.     return 0;
  4920.  
  4921.       if (GET_CODE (arg) == CONST_INT)
  4922.     {
  4923.       /* Can replace with any giv that has constant coefficients.  */
  4924.  
  4925.       for (v = bl->giv; v; v = v->family)
  4926.         if (GET_CODE (v->mult_val) == CONST_INT
  4927.         && GET_CODE (v->add_val) == CONST_INT
  4928.         && ! v->ignore
  4929.         && v->mode == mode)
  4930.           return 1;
  4931.  
  4932.       /* Look for giv with constant mult_val and nonconst add_val,
  4933.          since we can insert add insn before loop
  4934.          to calculate new compare value.  */
  4935.  
  4936.       for (v = bl->giv; v; v = v->family)
  4937.         if (GET_CODE (v->mult_val) == CONST_INT
  4938.         && ! v->ignore
  4939.         && v->mode == mode)
  4940.           return 1;
  4941.     }
  4942.       else if (GET_CODE (arg) == REG || GET_CODE (arg) == MEM)
  4943.     {
  4944.       /* Comparing against invariant register or memref can be handled.  */
  4945.  
  4946.       if (invariant_p (arg))
  4947.         {
  4948.           /* Look for giv with constant mult_val and nonconst add_val.
  4949.          Insert add-insn before loop to compute new compare value.  */
  4950.  
  4951.           for (v = bl->giv; v; v = v->family)
  4952.         if ((GET_CODE (v->mult_val) == CONST_INT)
  4953.             && ! v->ignore
  4954.             && v->mode == mode)
  4955.           return 1;
  4956.         }
  4957.  
  4958.       /* Otherwise, only comparing against a biv can be handled.  */
  4959.       if (GET_CODE (arg) != REG
  4960.           || induct_var[REGNO (arg)] != BASIC_INDUCT)
  4961.         return 0;
  4962.  
  4963.       /* Look for a giv for each biv that have identical
  4964.          values for mult_val and add_val.  */
  4965.       for (v = bl->giv; v; v = v->family)
  4966.         if (v->mode == mode
  4967.         && ! v->ignore)
  4968.           {
  4969.         for (tv = class_struct[REGNO (arg)]->giv; tv; tv = tv->family)
  4970.           if ((tv->new_reg != 0)
  4971.               && rtx_equal_p (tv->mult_val, v->mult_val)
  4972.               && rtx_equal_p (tv->mult_val, v->mult_val)
  4973.               && ! tv->ignore
  4974.               && tv->mode == mode)
  4975.             return 1;
  4976.           }
  4977.     }
  4978.       return 0;
  4979.  
  4980.     default:
  4981.       return 0;
  4982.     }
  4983. }
  4984.  
  4985. /* Rewrite a compare insn INSN which uses the biv described by BL
  4986.    so that it doesn't use that biv any more.
  4987.    Instead it will use some reduced giv related to that biv.
  4988.  
  4989.    The preceding function is very parallel to this one.  */
  4990.  
  4991. static void
  4992. eliminate_biv (insn, bl, loop_start)
  4993.      rtx insn;
  4994.      struct iv_class *bl;
  4995.      rtx loop_start;
  4996. {
  4997.   rtx src = SET_SRC (PATTERN (insn));
  4998.   enum rtx_code code = GET_CODE (src);
  4999.   struct induction *v, *tv;
  5000.   rtx arg;
  5001.   int arg_operand;
  5002.   /* Mode of this biv.  */
  5003.   enum machine_mode mode = bl->biv->mode;
  5004.  
  5005.   switch (code)
  5006.     {
  5007.       /* a test insn */
  5008.     case REG:
  5009.       /* Can replace with any giv that was reduced and
  5010.      that has (MULT_VAL != 0) and (ADD_VAL == 0).
  5011.      Require a constant integer for MULT_VAL, so we know it's nonzero.  */
  5012.  
  5013.       for (v = bl->giv; v; v = v->family)
  5014.     if (GET_CODE (v->mult_val) == CONST_INT && v->mult_val != const0_rtx
  5015.         && v->add_val == const0_rtx
  5016.         && v->new_reg != 0
  5017.         && v->mode == mode)
  5018.       break;
  5019.       if (v)
  5020.     {
  5021.       /* We can test the sign of that giv's reduced reg.  */
  5022.       SET_SRC (PATTERN (insn)) = v->new_reg;
  5023.       return;
  5024.     }
  5025.  
  5026.       /* Look for a giv with (MULT_VAL != 0) and (ADD_VAL != 0)
  5027.      where ADD_VAL is a constant or a register;
  5028.      replace test insn with a compare insn (cmp REDUCED_GIV ADD_VAL).
  5029.      Require a constant integer for MULT_VAL, so we know it's nonzero.  */
  5030.  
  5031.       for (v = bl->giv; v; v = v->family)
  5032.     if (GET_CODE (v->mult_val) == CONST_INT && v->mult_val != const0_rtx
  5033.         && (GET_CODE (v->add_val) == REG || GET_CODE (v->add_val) == CONST_INT)
  5034.         && v->new_reg != 0
  5035.         && v->mode == mode)
  5036.       break;
  5037.       if (v)
  5038.     {
  5039.       /* Replace biv with the giv's reduced register.  */
  5040.       SET_SRC (PATTERN (insn)) = gen_rtx (COMPARE, GET_MODE (v->new_reg),
  5041.                           v->new_reg,
  5042.                           copy_rtx (v->add_val));
  5043.  
  5044. #if 0
  5045.       /* add_val must be invariant, so don't bother storing in a register */
  5046.       /* calculate the appropriate constant to compare against */
  5047.       emit_insn_before (gen_rtx (SET, VOIDmode, compare_value,
  5048.                      copy_rtx (v->add_val)),
  5049.                 loop_start);
  5050. #endif
  5051.       return;
  5052.     }
  5053.       abort ();
  5054.       break;
  5055.  
  5056.       /* a compare insn */
  5057.     case COMPARE:
  5058.       /* Figure out which operand is the biv.  */
  5059.       if (GET_CODE (XEXP (src, 0)) == REG
  5060.       && REGNO (XEXP (src, 0)) == bl->regno)
  5061.     {
  5062.       arg = XEXP (src, 1);
  5063.       arg_operand = 1;
  5064.     }
  5065.       else if (GET_CODE (XEXP (src, 1)) == REG
  5066.            && REGNO (XEXP (src, 1)) == bl->regno)
  5067.     {
  5068.       arg = XEXP (src, 0);
  5069.       arg_operand = 0;
  5070.     }
  5071.       else
  5072.     abort ();
  5073.  
  5074.       if (GET_CODE (arg) == CONST_INT)
  5075.     {
  5076.       /* Can replace with any giv that has constant mult_val and add_val.
  5077.          Make sure it was strength reduced by checking new_reg != 0.  */
  5078.  
  5079.       for (v = bl->giv; v; v = v->family)
  5080.         if (GET_CODE (v->mult_val) == CONST_INT
  5081.         && GET_CODE (v->add_val) == CONST_INT
  5082.         && v->new_reg
  5083.         && v->mode == mode)
  5084.           break;
  5085.       if (v)
  5086.         {
  5087.           rtx newval;
  5088.           /* Replace biv with the giv's reduced reg.  */
  5089.           XEXP (src, 1-arg_operand) = v->new_reg;
  5090.           /* Calculate the appropriate constant to compare against.  */
  5091.           newval = gen_rtx (CONST_INT, VOIDmode,
  5092.                 (INTVAL (arg) * INTVAL (v->mult_val)
  5093.                  + INTVAL (v->add_val)));
  5094.           XEXP (src, arg_operand) = newval;
  5095.           /* If that constant is no good in a compare,
  5096.          put it in a register.  */
  5097.           if (recog (PATTERN (insn), insn) < 0)
  5098.         {
  5099.           rtx temp = gen_reg_rtx (mode);
  5100.           emit_iv_init_code (arg, v->mult_val, v->add_val,
  5101.                      temp, loop_start);
  5102.           XEXP (src, arg_operand) = temp;
  5103.         }
  5104.           return;
  5105.         }
  5106.  
  5107.       /* Look for giv with constant mult_val and nonconst add_val.
  5108.          Insert add insn before loop to calculate new compare value.  */
  5109.  
  5110.       for (v = bl->giv; v; v = v->family)
  5111.         if (GET_CODE (v->mult_val) == CONST_INT
  5112.         && v->new_reg
  5113.         && v->mode == mode)
  5114.           break;
  5115.       if (v)
  5116.         {
  5117.           rtx compare_value = gen_reg_rtx (mode);
  5118.  
  5119.           /* Replace biv with giv's reduced register.  */
  5120.           XEXP (src, 1-arg_operand) = v->new_reg;
  5121.  
  5122.           /* At start of loop, compute value to compare against.  */
  5123.           emit_iv_init_code (arg, v->mult_val, v->add_val,
  5124.                  compare_value, loop_start);
  5125.           /* Use it in this insn.  */
  5126.           XEXP (src, arg_operand) = compare_value;
  5127.           return;
  5128.         }
  5129.       abort ();
  5130.     }
  5131.       else if (GET_CODE (arg) == REG || GET_CODE (arg) == MEM)
  5132.     {
  5133.       if (invariant_p (arg))
  5134.         {
  5135.           /* Look for giv with constant mult_val and nonconst add_val.
  5136.          Insert add-insn before loop to compute new compare value.  */
  5137.  
  5138.           for (v = bl->giv; v; v = v->family)
  5139.         if (GET_CODE (v->mult_val) == CONST_INT
  5140.             && v->new_reg
  5141.             && v->mode == mode)
  5142.           break;
  5143.           if (v)
  5144.         {
  5145.           rtx compare_value = gen_reg_rtx (mode);
  5146.  
  5147.           /* Replace biv with giv's reduced register.  */
  5148.           XEXP (src, 1-arg_operand) = v->new_reg;
  5149.  
  5150.           /* At start of loop, compute value to compare against.  */
  5151.           emit_iv_init_code (arg, v->mult_val, v->add_val,
  5152.                      compare_value, loop_start);
  5153.           XEXP (src, arg_operand) = compare_value;
  5154.           return;
  5155.         }
  5156.         }
  5157.  
  5158.       /* Otherwise the reg compared with had better be a biv.  */
  5159.       if (GET_CODE (arg) != REG
  5160.           || induct_var[REGNO (arg)] != BASIC_INDUCT)
  5161.         abort ();
  5162.  
  5163.       /* Look for a pair of givs, one for each biv,
  5164.          with identical coefficients.  */
  5165.       for (v = bl->giv; v; v = v->family)
  5166.         {
  5167.           if (!v->new_reg && v->mode == mode)
  5168.         continue;
  5169.           for (tv = class_struct[REGNO (arg)]->giv; tv; tv = tv->family)
  5170.         if ((tv->new_reg != 0)
  5171.             && rtx_equal_p (tv->mult_val, v->mult_val)
  5172.             && rtx_equal_p (tv->add_val, v->add_val)
  5173.             && tv->mode == mode)
  5174.           break;
  5175.           if (tv)
  5176.         break;
  5177.         }
  5178.       if (v)
  5179.         {
  5180.           /* Replace biv with its giv's reduced reg.  */
  5181.           XEXP (src, 1-arg_operand) = v->new_reg;
  5182.           /* Replace other operand with the other giv's reduced reg.  */
  5183.           XEXP (src, arg_operand) = tv->new_reg;
  5184.           return;
  5185.         }
  5186.     }
  5187.       abort ();
  5188.  
  5189.     default:
  5190.       abort ();
  5191.     }
  5192. }
  5193.  
  5194. /* Try to calculate the final value of the biv,
  5195.    the value it will have at the end of the loop.
  5196.    If we can do it, return that value.  */
  5197.  
  5198. /* ??? One case that should be simple to handle
  5199.    is when the biv is incremented by an invariant
  5200.    exactly once each time around the loop,
  5201.    and when the number of iterations can be determined
  5202.    (as the value of some invariant).
  5203.    Then the final value would be BIV + (INCREMENT * NUM_ITERATIONS).
  5204.  
  5205.    Once that case is handled, it would become desirable to detect empty
  5206.    loops and delete them, since this optimization could make empty loops.  */
  5207.  
  5208. static rtx
  5209. final_biv_value (bl, loop_end)
  5210.      struct iv_class *bl;
  5211.      rtx loop_end;
  5212. {
  5213.   /* wimpy, but guaranteed to work */
  5214.   return 0;
  5215. }
  5216.  
  5217. /* Return nonzero if the last use of reg REGNO
  5218.    is in an insn following INSN in the same basic block.  */
  5219.  
  5220. static int
  5221. last_use_this_basic_block (regno, insn)
  5222.      int regno;
  5223.      rtx insn;
  5224. {
  5225.   rtx n;
  5226.   for (n = insn;
  5227.        n && GET_CODE (n) != CODE_LABEL && GET_CODE (n) != JUMP_INSN;
  5228.        n = NEXT_INSN (n))
  5229.     {
  5230.       if (regno_last_uid[regno] == INSN_UID (n))
  5231.     return 1;
  5232.     }
  5233.   return 0;
  5234. #endif /* we really hate it */
  5235. }
  5236.